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《Python 程序 设计 》 


Python 是 由 Guido van Rossum 于 1989 年 底 发 明 的 ,第 一 个 公开 发 行 版 发 行 于 1991 
年 。Python 推出 不 久 便 迅 速 得 到 各 行业 人 士 的 青睐 ,目前 已 经 渗透 到 计算 机 科学 与 技术 、 
统计 分 析 ,移动 终端 开发 .科学 计算 可 视 化 、 逆 向 工程 与 软件 分 析 、 图 形 图 像 处 理 、 人 工 智能 、 
游戏 设计 与 策划 等 几乎 所 有 专业 和 领域 ,并 且 已 经 成 为 卡耐基 。 梅 隆 大 学 、. 麻 省 理工 学 院 、 
加 州 大 学 伯克利 分 校 、 哈 佛 大 学 等 国外 很 多 大 学 计算 机 专业 和 非 计算 机 专业 的 程序 设计 入 
门 教学 语言 ,国内 也 有 不 少 学 校 陆续 开设 了 Python 程序 设计 课程 。Python 语言 连续 多 年 
在 TIOBE 网 站 的 编程 语言 排行 榜 上 排名 七 八 位 左右 ,并 于 2011 年 1 月 被 TIOBE 网 站 评 为 
2010 年 年 度 语言 。 在 2014 年 12 月 份 IEEE Spectrum 推出 的 编程 语言 排行 榜 中 ,Python 
更 是 取得 了 第 5 位 的 好 名 次 。 

Python 是 一 门 开 源 的 高 级 动态 编程 语言 ,支持 命令 式 编程 .函数 式 编程 .面向 对 象 程序 
设计 ,语法 简洁 清晰 ,并 且 拥 有 大 量 功 能 丰富 而 强大 的 标准 库 和 扩展 库 , 可 以 帮助 各 领域 的 
科研 人 员 或 策划 师 ,以 及 管理 人 员 快 速 实现 并 验证 自己 的 思路 与 创意 。Python 使 得 用 户 可 
以 把 主要 精力 放 在 业务 逻辑 的 设计 与 实现 上 ,而 不 用 过 多 考虑 语言 本 身 的 细节 ,开发 效率 非 
常 高 ,其 精妙 之 处 令 人 赞叹 。 另 外 ,还 可 以 使 用 py2exe 工具 将 Python 程序 轻易 转换 为 exe 
可 执行 程序 , 它 脱离 Python 解释 器 以 便 在 没有 安装 Python 环境 的 Windows 平台 运行 , 极 
大 地 方便 了 用 户 的 使 用 。 

Python 是 一 门 快乐 的 语言 ,学 习 和 使 用 Python 也 是 一 个 快乐 的 过 程 。 与 C 语言 系列 
或 Java 等 语言 相 比 ,Python 更 容易 学 习 和 使 用 ,但 这 并 不 意味 着 可 以 非常 轻松 愉快 地 掌握 
Python。 熟 练 掌握 和 运用 Python 仍 需要 通过 大 量 的 练习 来 锻炼 自己 的 思维 和 熟悉 Python 
编程 模式 ,同时 还 需要 经 常 关注 Python 社区 优秀 的 代码 以 及 各 种 扩展 库 的 动态 。 

Python 是 一 门 优雅 的 语言 。 如 果 您 有 其 他 程序 设计 语言 的 基础 ,那么 在 学 习 和 使 用 
Python 的 时 候 , 一 定 不 要 把 其 他 语言 的 编程 习惯 带 到 Python 中 来 。 您 应 该 尽量 尝试 从 最 
自然 .最 简洁 的 角度 出 发 去 思考 和 解决 问题 ,这 样 才能 写 出 更 加 优雅 ,更 加 Pythonic 的 
代码 。 


本 书 内 容 组 织 


全 书 共 两 篇 17 章 , 第 一 篇 重点 介绍 和 讲解 Python 程序 设计 基础 知识 ,主要 包括 
Python 基本 数据 结构 ,控制 结 构 ,正则 表达 式 、 类 与 函数 设计 文件 操作 、 异 常 处 理 与 程序 调 
试 等 内 容 。 第 二 篇 通过 大 量 的 案例 介绍 Python 的 多 个 扩展 库 在 GUI 编程 .图 形 图 像 编程 、 
音乐 编程 与 语音 识别 、 科 学 计算 可 视 化 、 网 络 编程 .逆向 工程 与 软件 分 析 、 大 数据 处 理 、 多 语 
言 混合 编程 和 Windows 系统 编程 等 方面 的 应 用 。 

在 真正 编写 和 开发 一 个 应 用 程序 时 ,需要 用 到 方方面面 的 知识 , 既 包括 Python 基本 语 
法 与 数据 结构 ,又 包括 选择 、 循 环 等 控制 语句 ,类 与 函数 设计 ,异常 处 理 结构 ,文件 处 理 , 以 及 
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各 种 扩展 库 的 综合 运用 ,甚至 还 有 可 能 需要 与 其 他 语言 结合 ,这 些 知 识 总 是 互相 交织 在 一 起 
的 ,很 难 彻底 分 开 。 因 此 ,在 编写 本 书 前 面 的 内 容 时 ,可 能 会 偶尔 用 到 后 面 的 知识 ,这 实在 是 
一 个 很 难 避 免 的 问题 。 虽 然 作 者 已 经 很 努力 地 把 内 容 组 织 为 容易 理解 的 形式 ,但 不 得 不 说 ， 
仍 有 很 多 知识 需要 您 前 后 翻阅 多 次 才能 真正 融会 贯通 。 

本 书 作者 具有 15 年 的 程序 设计 教学 经 验 , 讲 授 过 多 门 程序 设计 语言 ,分 别 使 用 汇编 语 
言 \C、C++ C£ „Java, PHP, Python 等 不 同 语言 编写 过 大 量 的 应 用 软件 。 在 本 书 内 容 的 组 
织 和 安排 上 ,结合 了 自己 多 年 的 应 用 开发 和 教学 工作 中 积累 的 许多 案例 ,把 实际 应 用 中 的 大 
TER LPs b RE A E YU CTS 

本 书 内 容 组 织 的 最 大 特点 是 不 仅 信息 量 大 ,而 且 知识 点 全 面 、 密 集 。 考 虑 到 Python 4X 
件 和 扩展 库 的 安装 过 程 较为 简单 , 绝 大 部 分 读者 都 能 够 顺利 安装 ,在 书 中 花费 大 量 篇 幅 一 步 
步 介绍 安装 过 程 的 意义 和 必要 性 并 不 大 。 因 此 ,在 整 本 书 中 都 没 插入 任何 软件 和 相关 扩展 
库 的 安装 过 程 截图 ,而 是 充分 利用 有 限 的 篇 幅 来 介绍 和 讲解 知识 点 ,可 以 说 是 物 超 所 值 。 

本 书 适用 读者 

本 书 不 仅 可 以 作为 Python 程序 设计 语言 课程 的 教材 和 具有 一 定 Python 基础 的 读者 
的 进 阶 学 习 资料 ,还 可 以 作为 多 个 领域 的 Python 应 用 开发 人 员 的 参考 书 , 既 可 以 作为 计算 
机 科学 与 技术 ,数字 媒体 技术 、 软 件 工程 .网络 工程 ,信息 安全 ,会 计 、 经 济 、 金 融 , 心 理学 、 统 
计 等 多 个 专业 本 科 和 研究 生 的 程序 设计 教材 ,也 可 以 作为 打算 使 用 Python 快速 实现 自己 
研究 思路 和 创意 的 科研 人 员 及 管理 人 员 的 参考 书 , 当 然 也 适合 那些 打算 利用 业余 时 间 学 习 
一 门 快乐 的 程序 设计 语言 并 编写 几 个 小 程序 来 娱乐 的 读者 。 

如 果 作 为 本 科 专 业 课 程 教材 ,建议 学 时 为 48 学 时 课堂 授课 十 16 学 时 上 机 实验 ,如 果 采 
用 边 讲 边 练 的 教学 模式 ,建议 控制 在 72 学 时 左右 ;如 果 作为 非 计算 机 专业 研究 生 教材 ,建议 
为 48 学 时 课堂 授课 ,上 机 部 分 可 以 由 研究 生 自行 完成 。 除 了 讲授 第 一 篇 中 全 部 知识 以 外 ， 
根据 学 生 基础 .专业 特点 和 培养 目标 ,再 酌情 选择 第 二 篇 中 的 部 分 章节 进行 讲解 。 另 外 ,第 
一 篇 的 知识 应 尽量 按照 本 书 组 织 的 先后 顺序 进行 讲解 和 学 习 , 而 第 二 篇 中 的 章节 可 根据 需 
要 进行 前 后 调整 ,并 不 一 定 要 严格 按照 本 书 的 顺序 。 如 果 作为 本 科 非 计算 机 专业 程序 设计 
语言 公共 课 或 选修 课 教材 ,建议 采用 48 学 时 边 讲 边 练 的 教学 模式 ,可 以 略 过 第 一 篇 中 的 高 
级 话题 以 及 第 8 章 的 内 容 , 再 根据 具体 的 学 生 专业 选择 第 二 篇 中 的 一 到 两 章 进 行 讲解 ,其余 
章节 可 以 由 学 生根 据 自己 的 兴趣 进行 阅读 。 


教学 资源 


本 书 提供 全 套 教学 课件 、 源 代码 , 课 后 习题 答案 与 分 析 以 及 授课 计划 和 学 时 分 配 表 , 配 
套 资源 可 以 登录 清华 大 学 出 版 社 官方 网 站 (www. tup. com. cn) 下 载 或 与 作者 联系 索取 , 作 
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者 电子 邮箱 为 dongfuguo2005@126. com, 
由 于 时 间 仓 促 , 作 者 水 平 有 限 , 书 中 难免 出 现 错误 和 不 足 之 处 ,还 请 同行 指正 并 通过 电 
子 邮 件 等 方式 进行 反馈 ,作者 将 不 定期 在 QQ 空间 和 微 信 发 布 及 更 新 勘误 表 。 
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第 一 篇 “Python 基础 


毫 无 疑问 ,对 于 Python 程序 员 来 说 ,能 够 熟练 运用 各 种 扩展 库 非常 重要 ， 
使 用 优秀 、 成 熟 的 扩展 库 可 以 帮助 人 们 快速 实现 自己 的 业务 逻辑 和 创意 。 但 也 
必须 清楚 地 认识 到 ,Python 语言 基础 知识 和 基本 数据 结构 的 熟练 掌握 是 理解 和 
运用 其 他 扩展 库 的 必 备 条 件 。 本 书 第 一 篇 详细 介绍 列表 元 组 字典、 字符 串 等 
基本 数据 结构 ,正则 表达 式 ,选择 、 循 环 等 主要 控制 结构 ,函数 设计 与 面向 对 象 
程序 设计 ,文本 文件 与 二 进 制 文件 操作 以 及 异常 处 理 结构 与 Python 程序 调试 
技术 。 为 了 更 好 地 演示 一 些 基础 知识 在 实际 开发 中 的 运用 ,有 时 候 不 得 不 在 前 
面 用 到 后 面 介 绍 的 知识 ,如 果 遇 到 这 种 情况 ,您 可 以 暂时 不 去 考虑 太 多 细节 , 当 
然 也 可 以 翻阅 后 面 的 内 容 或 者 查阅 相关 文档 来 帮助 理解 。 
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Python 是 一 门 跨 平台 的 开源 、 免 费 的 解释 型 脚本 语言 ,同时 也 支持 伪 编 译 以 进行 优化 
和 提高 运行 速度 ,还 支持 使 用 py2exe 工具 将 Python 程序 转换 为 exe 可 执行 程序 以 使 得 可 
以 在 没有 安装 Python 解释 器 和 相关 依赖 包 的 平台 上 运行 ;Python 同时 支持 命令 式 编程 、 函 
数 式 编程 和 面向 对 象 的 编程 ,语法 简洁 清晰 ,并且 拥 有 大 量 的 几乎 支持 所 有 领域 应 用 开发 的 
成 熟 扩展 库 ;最 后 ,Python 就 像 胶水 一 样 , 可 以 把 多 种 不 同 语言 编写 的 程序 融合 到 一 起 实现 
无 缝 拼接 ,更 好 地 发 挥 不 同 语言 和 工具 的 优势 。 


1.1 Python 语言 版 本 之 争 


众所周知 ,Python 目前 同时 发 行 Python 2. x 和 Python 3. x 两 个 不 同系 列 的 版 本 ,并且 
互相 之 间 不 兼容 ,在 本 书 开始 编写 的 时 候 , 最 新 版 本 分 别 为 Python 2. 7. 8 和 了 Python 3.4.2， 
本 书 编写 完成 时 最 新 版 本 分 别 为 Python 2. 7. 9 和 Python 3. 4. 3。 对 于 很 多 初级 用 户 而 言 ， 
最 纠结 的 一 个 问题 很 可 能 是 自己 到 底 应 该 选择 哪个 版 本 ,是 选择 Python 2. x 还 是 Python 
3.x 呢 ? 是 选择 Python 2.7.x 还 是 Python 2.6.x 呢 ? 对 于 Python 的 版 本 演化 历史 ,这 里 
不 多 解释 ,需要 说 明 的 是 ,并 不 是 数字 越 大 表示 版 本 越 新 ,例如 Python 2.7.9 比 Python 3.3 
晚 几 个 月 发 行 。 另 外 ,虽然 同系 列 的 版 本 中 高 版 本 比 低 版 本 更 加 完善 和 成 熟 ,但 这 并 不 意味 
着 最 新 的 才 是 最 适合 您 的 。 这 是 因为 很 多 扩展 库 的 发 行 总 是 滞后 于 Python 发 行 的 版 本 ， 
甚至 目前 还 有 很 多 扩展 库 不 支持 Python 3。 因 此 ,在 选择 Python 的 时 候 , 一 定 要 先 考 虑 清 
楚 自 己 学 习 Python 的 目的 是 什么 ,打算 做 哪 方面 的 开发 ,有 哪些 扩展 库 可 用 ,这 些 扩展 库 
最 高 支持 哪个 版 本 的 Python ,是 Python 2. x 还 是 Python 3. x, 最 高 支持 到 Python 2. 7. 6 还 
是 Python 2.7.9。 这 些 问题 都 确定 以 后 .再 做 出 自己 的 选择 ,这 样 才能 事半功倍 ,而 不 至 于 
把 太 多 时 间 浪 费 在 Python 以 及 扩展 库 的 反复 安装 和 和 印 载 上 。 同 时 还 应 该 注意 , 当 更 新 的 
Python 版 本 推出 之 后 ,不 要 急于 更 新 ,而 是 应 该 确定 自己 所 必须 使 用 的 扩展 库 也 推出 了 较 
新 版 本 之 后 再 一 起 进行 更 新 。 

尽管 如 此 ,Python 3. x 毕 竞 是 大 势 所 趋 ,如 果 您 暂时 还 没 想 到 要 做 什么 行业 领域 的 应 
用 开发 ,或 者 仅仅 是 为 了 尝试 一 种 新 的 ,好 玩 的 语言 ,那么 请 毫 不 犹 殉 地 选择 Python 3. x 系 
列 的 最 高 版 本 (目前 是 Python 3. 4. 3) 。 作 者 也 相信 , 越 来 越 多 的 扩展 库 将 会 在 短 时 间 内 推 
出 支持 Python 3. x 的 版 本 。 

安装 好 Python 之 后 ,在 “开始 ”菜单 中 启动 IDLE(Python GUI) 即 可 启动 Python 解释 
器 并 可 以 看 到 当前 安装 的 Python 版 本 号 ,如 图 1-1 和 图 1-2 所 示 。 当 然 ,也 可 以 启动 
Python(command line) 来 开始 美妙 的 Python 之 旅 。 在 IDLE(Python GUI) 和 Python 
(command line) 两 种 界面 中 ,都 以 3 个 大 于 号 二 二 二 作为 提示 符 , 可 以 在 提示 符 后 面 输入 要 
执行 的 语句 。 在 本 书 给 出 的 示例 代码 中 ,二 二 二 符号 不 需要 输入 , 仅 表 示 该 代码 是 在 交互 式 
方式 下 运行 ,而 不 带 有 该 提示 符 的 代码 则 表示 是 以 脚本 程序 的 方式 运行 的 。 本 书 主要 使 用 
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IDLE(Python GUD3E 4r £l Python 程序 的 开发 与 应 用 。 


File Edit Shell Debug Options Windows Help 
Python 2.7.8 (default, Jun 30 2014, 16:08:48) [MSC v zl 
.1500 64 bit (AMD64)] on win32 

Type "copyright", "credits" or "license()" for more 
information. 

»»» copyright 

Copyright (c) 2001-2014 Python Software Foundation. 

All Rights Reserved. 


Copyright (c) 2000 BeOpen.com. 
All Rights Reserved. 


Copyright (c) 1995-2001 Corporation for National Res 
earch Initiatives. 
A11 Rights Reserved. 


Copyright (c) 1991-1995 Stichting Mathematisch Centr 
um, Amsterdam. 

All Rights Reserved. 

>>> 


图 1-1 Python 2.7.8 主 界面 


La Python 3.4.2 Shell Fere] 


File Edit Shell Debug Options Windows Help 


Python 3.4.2 (v3.4.2:ab2c023a9432, Oct 6 2014, 
22:16:31) [MSC v.1600 64 bit (AMD64)] on win32 
Type "copyright", "credits" or "license()" for 
more information. 
»»» credits 

Thanks to CWI, CNRI, BeOpen.com, Zope Corpo 
ration and a cast of thousands 

for supporting Python development. See www 
-python.org for more information. 
>>> 


图 1-2 Python 3. 4. 2 主 界面 


除了 在 启动 主 界面 上 查看 已 安装 的 Python 解释 器 版 本 之 外 ,还 可 以 使 用 命令 进行 查 
看 ,例如 : 


>>> import sys 

>>> sys.version 

"3.4.2 (v3.4.2:ab2c023a9432, Oct 6 2014, 22:16:31) [MSC v.1600 64 bit (AMD64)]" 
>>> sys.winver 

19.7" 

>>> sys.version_info 


sys.version_info(major=2, minor=7, micro=8, releaselevel- 'final', serial=0) 


有 时 候 可 能 需要 同时 安装 多 个 不 同 的 版 本 ,例如 同时 安装 Python 2. 7. 8 和 Python 
3. 4. 2, 并 根据 不 同 的 开发 需求 在 两 个 版 本 之 间 进 行 切换 。 如 果 无 法 正常 运行 程序 的 话 ,可 
以 在 调用 Python 主 程序 时 指定 其 完整 路 径 ,或 者 通过 修改 系统 Path 变量 来 实现 不 同 版 本 
之 间 的 切换 。 在 Windows 7 系统 下 修改 系统 Path 变量 的 步骤 如 下 : 单 击 “ 开 始 ” 菜 单 , 在 弹 
出 的 菜单 中 右 击 “ 计 算 机 ”并 选择 “属性 ”, 单 击 “ 高 级 系统 设置 "切换 至 “高 级 "选项 卡 , 单 击 
“环境 变量 ”, 然 后 修改 系统 Path 变量 中 Python 的 安装 路 径 , 如 图 1-3 所 示 。 
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进行 开发 和 演示 。 


图 1-3 Windows 7 环境 中 系统 Path 变量 的 修改 方法 


1.2 Python 安装 与 简单 使 用 


关于 Python 的 安装 步骤 这 里 就 不 再 袭 述 了 , 它 的 安装 与 大 多 数 软件 的 安装 并 没什么 
明显 的 不 同 , 打 开 Python 官方 主页 https://www. python. org/ ,然后 选择 适合 自己 的 版 本 
下 载 安 装 即 可 。 如 果 使 用 Linux 系统 ,例如 Ubuntu, 那 么 很 可 能 已 经 预 装 了 某 个 版 本 的 
Python, 请 根据 需要 进行 升级 。 未 经 特别 说 明 的 话 , 本 书 所 有 示例 均 在 Windows 7 平台 上 


安装 好 以 后 ,默认 以 IDLE 为 开发 环境 ,当然 也 可 以 安装 使 用 其 他 开发 环境 。 本 书 均 以 
IDLE 为 例 ,如 果 使 用 交互 式 编程 模式 .那么 直接 在 IDLE 提示 符 ( 二 二 二 ) 后 面 输入 相应 的 
命令 并 回 车 执行 即 可 ,如 果 执 行 正常 的 话 , 马 上 就 可 以 看 到 执行 结果 。 例 如 : 


>>>#5 

8 

>>> import math 
»»»math.sqrt (9) 
3.0 

>>>3x (2+6) 

24 


一 般 来 讲 ,用 户 可 能 更 需要 编写 Python 程序 来 实现 特定 的 业务 逻辑 ,同时 也 方便 代码 
的 不 断 完善 和 重复 利用 ,毕竟 直接 使 用 交互 编程 模式 不 是 很 方便 ,此 时 可 以 在 IDLE 界面 中 


和 一 一 
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执行 File New File 命令 创建 程序 文件 ,输入 程序 并 保存 为 文件 (务必 要 保证 扩展 名 为 py) 
后 ,执行 Run 一 Run Module 命令 运行 ,程序 运行 结果 将 直接 显示 在 IDLE 交互 界面 上 。 除 
此 之 外 ,也 可 以 通过 在 资源 管理 器 中 双击 扩展 名 为 py 的 Python 程序 文件 来 运行 ;在 有 些 情况 
下 ,可 能 还 需要 您 在 命令 提示 符 环境 中 运行 Python 程序 文件 。 在 “开始 ”菜单 的 “附件 ”中 单 击 
“命令 提示 符 ”, 然 后 执行 Python 程序 。 例 如 ,假设 有 程序 helloworld. py, 其 内 容 如 下 : 


def main(): 
print ("Hello world') 
main() 
在 IDLE 环境 中 运行 该 程序 后 ,结果 如 图 1-4 所 示 。 在 命令 提示 符 环境 中 运行 该 程序 
后 ,结果 如 图 1-5 所 示 , 图 中 演示 了 两 种 执行 Python 程序 的 方法 ,虽然 第 二 种 方法 看 上 去 更 
加 简单 ,但 是 请 尽量 使 用 第 一 种 方法 来 运行 Python 程序 。 


图 1-4 在 IDLE 中 运行 程序 图 1-5 在 命令 提示 符 中 运行 程序 
E 实 际 开发 中 ,如 果 能 够 熟练 使 用 集成 开发 环境 IDLE 提供 的 一 些 快捷 键 ,将 会 大 幅度 
提高 编写 速度 和 开发 效率 。 在 IDLE 环境 下 ,比较 常用 的 快捷 键 如 表 1-1 所 示 。 
表 1-1 IDLE 环境 下 常用 快捷 键 


快捷 键 功能 说 明 

Alt+P 浏览 历史 命令 (上 一 条 ) 

Alt+N 浏览 历史 命令 (下 一 条 ) 

Ctrl 十 F6 重启 Shell, 之 前 定义 的 对 象 全 部 无 效 

Fl 打开 Python 帮助 文档 

Alt 十 / 自动 补 全 前 面 曾 经 出 现 过 的 单词 ,在 多 个 单词 中 循环 选择 
Ctrl 十 ] 缩 进 代码 块 

Ctrl 十 [ 取消 代码 块 缩 进 

Alt+3 注释 代码 块 

Alt 十 4 取消 代码 块 注释 


1.3 使 用 pip 管理 扩展 库 


目前 ,pip 已 经 成 为 管理 Python 扩展 库 ( 或 模块 ,一 般 不 做 区 分 ) 的 主流 方式 ,大 多 数 扩 
展 库 都 支持 这 种 方式 进行 安装 、 升 级 、 印 载 等 操作 ,使 用 这 种 方式 管理 Python 扩展 库 只 需 
要 在 保证 计算 机 联网 的 情况 下 输入 几 个 命令 即 可 完成 , 极 大 地 方便 了 用 户 。 
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在 Python 2. 7. 9 和 Python 3. 4. 0 之 前 ,需要 首先 安装 pip 命令 ,而 在 Python 2. 7. 9 以 
及 Python 3. 4. 0 之 后 的 安装 包 中 则 已 经 集成 了 该 命令 。 在 Python 2. 7. 9 和 Python 3. 4.0 
之 前 , 首先 从 https://pypi. python. org/pypi/pip 下 载 文件 get-pip. py, 然 后 在 命令 提示 符 
下 执行 命令 : 

Python get-pip.py 
即 可 自动 完成 pip 的 安装 。 当 然 , 需 要 保证 计算 机 处 于 联网 状态 。 

安装 完成 以 后 ,就 可 以 在 命令 提示 符 下 使 用 pip 来 完成 扩展 库 的 安装 、 升 级 、 印 载 等 操 
作 ,pip 常用 命令 的 使 用 方法 如 表 1-2 所 示 。 

表 1-2 pip 常用 命令 的 使 用 方法 


pip 命令 示例 说 明 
pip install SomePackage 安装 SomePackage 模块 
pip list 列 出 当前 已 安装 的 所 有 模块 
pip install —upgrade SomePackage 升级 SomePackage 模块 
pip uninstall SomePackage EI$ SomePackage 模块 


1.4 Python 基础 知识 


本 节 重 点 介绍 Python ifi zi SER ADR, 82459] 58 E08 , 2E Bt is SETTE AE SK AT PR 


以 及 数字 、 字 符 串 等 内 置 基本 数据 类 型 等 。 这 些 基础 知识 对 于 后 续 知 识 的 理解 非常 重要 , 建 
议 读者 掌握 和 理解 。 


1.4.1 Python 对 象 模型 


对 象 是 Python 语言 中 最 基本 的 概念 之 一 ,在 Python 中 的 一 切 都 是 对 象 ,这 一 点 可 能 
与 其 他 面向 对 象 程序 设计 语言 略 有 区 别 。Python 中 有 许多 内 置 对 象 可 供 编程 者 直接 使 用 ， 
例如 数字 .字符 串 列表、 元 组 字典、 集合 del 命令 以 及 cmp() \len() ,idO .typeO SARA 
置 函数 ;有 些 对 象 则 需要 导入 模块 (有 些 模 块 还 需要 单独 进行 安装 ) 后 才能 使 用 ,如 math 模 
块 中 的 正弦 函数 sin() ,random 模块 中 的 随机 数 产生 函数 random() 等 。 

在 Python 中 内 置 了 大 量 的 常用 对 象 ,这 些 内 置 对 象 或 类 型 无 须 导 和 模块 即 可 直接 使 
用 ,Python 常用 内 置 对 象 如 表 1-3 所 示 。 


1.4.2 Python 变量 


在 Python 中 ,不 需要 事先 声明 变量 名 及 其 类 型 ,直接 赋值 即 可 创建 各 种 类 型 的 对 象 变 
量 。 例 如 语句 


>>>x =3 


创建 了 整 型 变量 x, 并 赋值 为 3。 


= 
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R 1-3 Python 常用 内 置 对 象 


对 象 闫 型 示 例 me 示 例 
数字 1234, 3.14, 3+4j 文件 f—open( data. dat’, 'r') 
字符 串 'swfu', "I'm student" ,"Python” | 集合 set('abc'), ('a', b', 'c'} 
列表 [1, 2,3], eyes [65211 布尔 型 True, False 
字典 {1:'food' ,2;'taste’, 3; import’) 空 类 型 None 
元 组 (2, —5, 6) smenam | TRAER I EOD 


需要 说 明 的 是 ,Python 属于 强 类 型 编程 语言 ,虽然 不 需要 在 使 用 之 前 显 式 地 声明 变量 
及 其 类 型 ,但 是 Python 解释 器 会 根据 赋值 或 运算 来 自动 推断 变量 类 型 。 每 种 类 型 支持 的 
运算 也 不 完全 一 样 ,因此 在 使 用 变量 时 需要 程序 员 自 己 确定 所 进行 的 运算 是 否 合适 ,以 免 出 
现 异 常 或 者 是 意料 之 外 的 结果 。 后 面 大 家 会 看 到 ,同一 个 运算 符 对 于 不 同类 型 的 数据 操作 
含义 和 计算 结果 也 是 不 一 样 的 。 另 外 ,Python 还 是 一 种 动态 类 型 语言 ,也 就 是 说 ,变量 的 类 
型 是 可 以 变化 的 。 例 如 : 


>>>x =3 

>>>print (type (x)) 
<class 'int'> 

>>>x = 'Hello world." 
>>>print (type (x)) 
<class 'str'> 

>>>x = [1,2,3] 
>>>print (type (x)) 


<class 'list'> 

在 上 面 的 代码 中 ,首先 创建 了 整 型 变量 x, 然 后 又 分 别 创建 了 字符 串 和 列表 类 型 的 变量 
x。 当 创建 了 字符 串 类 型 的 变量 x 之 后 ,之 前 创建 的 整 型 变量 x 自动 失效 ,创建 列表 对 象 x 
之 后 ,之 前 创建 的 字符 串 变 量 x 自动 失效 。 可 以 将 该 模型 理解 为 状态 机 , 即 修改 其 类 型 或 删 
除 之 前 ,变量 将 一 直 保 持 上 次 的 类 型 。 

在 大 多 数 情况 下 ,如 果 变 量 出 现在 赋值 运算 符 或 复合 赋值 运算 符 ( 例 如 十 一 、* 一 等 ) 的 
左边 , 则 表示 创建 变量 或 修改 变量 的 值 ,否则 表示 引用 该 变量 的 值 ,这 一 点 同样 适用 于 使 用 
下 标 来 访问 列表 、 字 典 等 可 变 序 列 以 及 其 他 自 定义 对 象 中 元 素 的 情况 。 例 如 : 


>>>x =3 # 创 建 整 型 变量 
>>>print (xxx2) 

9 

>>>x +=6 # 修 改变 量 值 

>>>print (x) # 读 取 变 量 值 并 输出 显示 
B 

>>>x = [12,3] # 创 建 列表 对 象 
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»»»print (x) 


[1, 2, 3] 

>>>x[1] =5 # 修 改 列表 元 素 值 
>>>print (x) # 输 出 显示 整个 列表 

[1, 5, 3] 

>>>print (x[2]) # 输 出 显示 列表 指定 元 素 
3 


后 面 会 提 到 ,字符 串 和 元 组 属于 不 可 变 序列 ,这 意味 着 不 能 通过 下 标的 方式 来 修改 其 中 
的 元 素 值 ,例如 ,下 面 的 代码 试图 修改 元 组 中 的 元 素 值 时 会 抛 出 异常 。 


>>>x = (1,2,3) 
>>>print x 
(1, 2, 3) 
>>>x[1] =5 
Traceback (most recent call last): 
File "<pyshell#7>", line 1, in «module» 
x[1] =5 
TypeError: 'tuple' object does not support item assignment 


另外 ,在 Python 中 ,允许 多 个 变量 指向 同一 个 值 ,例如 : 


>>>x =3 
>>>id(x) 
1786684560 
>>>y =x 
>>> id(y) 
1786684560 


然而 ,需要 注意 的 是 ,继续 上 面 的 示例 代码 , 当 为 其 中 一 个 变量 修改 值 以 后 ,其 内 存 地 址 
将 会 变化 ,但 这 并 不 影响 另 一 个 变量 ,例如 ,接着 上 面 的 代码 再 继续 执行 下 面 的 代码 : 

>>>X +=6 

»»»id(x) 

1786684752 

>>>y 

3 

>>> id(y) 

1786684560 


在 这 段 代码 中 ,idO 〇 函数 用 来 返回 变量 所 指 值 的 内 存 地 址 。 可 以 看 出 ,在 Python H 
改变 量 值 的 操作 ,并 不 是 修改 了 变量 的 值 ,而 是 修改 了 变量 的 指向 。 这 是 因为 Python 解释 
器 首先 读 取 变 量 x 原来 的 值 , 然 后 将 其 加 6, 并 将 结果 存放 于 内 存 中 ,最 后 将 变量 x 指向 该 
结果 的 内 存 空间 ,理解 这 一 点 对 于 以 后 的 编程 非常 重要 。Python 内 存 管理 模式 如 图 1-6 
所 示 。 

Python 采用 的 是 基于 值 的 内 存 管理 方式 ,如 果 为 不 同 变 量 赋值 为 相同 值 , 则 在 内 存 中 
只 有 一 份 该 值 ,多 个 变量 指向 同一 块 内 存 地 址 ,例如 : 
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*6|1 


(a) x73 (b) x +=6 
图 1-6 Python 内 存 管理 模式 


>>>x =3 
»»»id(x) 
10417624 
>>>y =3 
>>> id(y) 
10417624 
>>>y =5 
>>> id(y) 
10417600 
>>> id (x) 
10417624 


Python 具有 自动 内 存 管理 功能 ,对 于 没有 任何 变量 指向 的 值 ,Python 自动 将 其 删除 。 
Python 会 跟踪 所 有 的 值 , 并 自动 删除 不 再 有 变量 指向 的 值 。 因 此 ,Python 程序 员 一 般 情 况 
下 不 需要 太 多 考虑 内 存 管理 的 问题 。 尽 管 如 此 , 显 式 释 放 不 需要 的 值 或 显 式 关 闭 不 再 需要 
访问 的 资源 , 仍 是 一 个 好 习惯 ,同时 也 是 一 个 优秀 的 程序 员 的 基本 素养 之 一 。 

最 后 ,在 定义 变量 名 的 时 候 , 需 要 注意 以 下 问题 。 

(1) 变量 名 必须 以 字母 或 下 划 线 开头 ,但 以 下 划 线 开头 的 变量 在 Python 中 有 特殊 含 
义 , 本 书后 面 第 6 章 会 详细 讲解 。 

(2) 变量 名 中 不 能 有 空格 和 标点 符号 (括号 .引号 .逗号 .和 斜 线 、 反 和 斜 线 . 冒号、 句号 和 问 
号 等 ) 。 

(3) 不 能 使 用 关键 字 作 为 变量 名 ,可 以 导入 keyword 模块 后 使 用 print (keyword. 
kwlist) 查 看 所 有 Python 关键 字 。 


>>> import keyword 

»»»keyword.kwlist 

['and', 'as', 'assert', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 
'except', 'exec', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 
'lambda', 'not', 'or', 'pass', 'print', 'raise', 'return', 'try', 'while', 
‘with', 'yield'] 

>>>and -3 


SyntaxError: invalid syntax 


(4) 不 建议 使 用 系统 内 置 的 模块 名 、 类 型 名 或 函数 名 作为 变量 名 ,这 将 会 改变 其 类 型 和 
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含义 ,可 以 通过 dir(_builtins_) 查 看 所 有 内 置 模块 、 类 型 和 函数 。 
(5) 变量 名 对 英文 字母 的 大 小 写 敏感 ,例如 student 和 Student 是 不 同 的 变量 。 


1.4.3 数字 


数字 属于 Python 不 可 变 对 象 ,1. 4. 2 节 的 例子 已 经 说 明了 这 一 点 , 即 修改 整 型 变量 值 
的 时 候 并 不 是 真 的 修改 变量 的 值 ,而 是 先 把 值 存放 到 内 存 中 然后 修改 变量 使 其 指向 了 新 的 
内 存 地 址 , 浮 点 数 、 复 数 等 数字 类 型 以 及 其 他 类 型 的 变量 具有 同样 的 特点 。 列 表 、 字 典 等 可 
变 类 型 对 象 的 情况 稍微 复杂 一 些 ,将 在 第 2 章 中 进行 详细 讲解 。 

在 Python 中 ,数字 类 型 变量 可 以 表示 任意 大 的 数值 ,例如 : 

>>> a= 99999999999999999999999999999999 

»»»a*a 

9999999999999999999999999999999800000000000000000000000000000001L 

»»»a* *3 

999999999999999999999999999999970000000000000000000000000000000299999999999999 

999999999999999999L 


当然 ,完全 可 以 把 IDLE 当 作 计 算 器 来 使 用 ,IDLE 可 以 实现 复杂 的 数学 运算 ,例如 : 
>>>3* (2+5)/3.0 

7.0 

>>> import math 


>>>math.sqrt (3**2+ 4**2) 
5.0 


Python 数值 类 型 主要 有 整数 、 浮 点 数 和 复数 。 整 数 类 型 主要 有 4 种 。 

(1) 十 进 制 整 数 。 如 0、 一 1、9、123。 

(2) 十 六 进 制 整数 。 使 用 16 个 数字 0、1、2、3、4、5、6、7、8、9、a、b、c.d、e、f 来 表示 整数 ， 
必须 以 Ox 开头 ,如 0x10、0xfa、0xabcdef。 

(3) 八进制 整数 。 使 用 8 个 数字 0、1、2、3、4、5、6、7 来 表示 整数 ,必须 以 0o 开头 ,如 
0o35 .0ol1。 

(4) 二 进 制 整数 。 使 用 2 个 数字 0、1 来 表示 整数 ,必须 以 Ob 开头 ,如 0b101、0b100。 

浮 点 数 也 称 为 小 数 ,例如 . 3.15.0.0.37、 一 11.2.1.2e2.314. 15e 一 2, 都 是 合法 的 浮 点 数 。 

Python 中 的 复数 与 数学 上 的 复数 形式 一 致 ,都 是 由 实 部 和 虚 部 构成 ,并 且 使 用 j BR J OK 
表示 虚 部 。 

>>>a =3+4j 

>>>b =5+ 6j 


>>>c =atb 


>>>c 

(8+ 104) 

»»»c.real # 查 看 复数 实 部 
8.0 

>>>c.imag # 查 看 复数 虚 部 


10.0 
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>>>a.conjugate () #38 EHHH A 

(3- 4j) 

>>>a*b 

(- 94383) 

>>>a/b 

(0.6393442622950819+ 0.03278688524590165j) 


1.4.4 FRR 


在 Python 中 ,字符 串 属于 不 可 变 序 列 ,一 般 使 用 单 引号 、 双 引号 或 三 引号 进行 界定 ,并 

目 单 引号 、 双 引号 .三 单 引 号 .三 双 引 号 还 可 以 互相 嵌 套 ,用 来 表示 复杂 字符 串 。 例 如 : 
'abc',123',rB E], "Python" , "Tom said. "Let's go" " 

都 是 合法 字符 串 , 空 字符 串 表 示 为 或 "或 "", 即 一 对 不 包含 任何 内 容 的 任意 字符 串 界定 符 。 
特别 地 ,一 对 三 单 引 号 或 三 双 引 号 表示 的 字符 串 支 持 换行 ,支持 排版 格式 较为 复杂 的 字符 
串 ,也 可 以 在 程序 中 表示 较 长 的 注释 ,后 面 将 分 别 进行 介绍 。 

由 于 字符 串 类 型 应 用 非常 广泛 ,其 支持 的 操作 也 较 多 ,这 里 先 简单 介绍 一 下 ,后 面 第 
4 音 再 结合 正则 表达 式 全面 进 行 详细 的 讲解 。 

字符 串 支 持 使 用 十 运算 符 进行 合并 以 生成 新 字符 串 , 例 如: 

>>>a ='abc' *'123' 

>>>a 

'abc123' 


可 以 对 字符 串 进行 格式 化 ,把 其 他 类 型 对 象 按 格 式 要 求 转换 为 字符 串 , 例 如 : 


>>>a=3.6674 

>>> '$7.3f' a 

' 3.667" 

>>> "$d: %c"% (65, 65) 

"65:A' 

>>>"""My name is $s, and my age is %d"""% ("Dong Fuguo', 38) 
"My name is Dong Fuguo, and my age is 38" 


Python 支持 转 义 字符 ,常用 的 转 义 字符 如 表 1-4 所 示 。 


表 1-4 转 义 字符 
转 义 字符 9 A 转 义 字符 ae A 
\n 换行 符 V 双 引 号 
M LE \\ =M 
\r 回 车 \ddd 3 位 八进制 数 对 应 的 字符 
V 单 引 号 \xhh 2 位 十 六 进 制 数 对 应 的 字符 


需要 特别 说 明 的 是 ,字符 串 界定 符 前 面 加 字母 + 或 R 表示 原始 字符 串 , 其 中 的 特殊 字符 
不 进行 转 义 ,但 字符 串 的 最 后 一 个 字符 不 能 是 \ 符 号 。 原 始 字符 串 主 要 用 于 正则 表达 式 ,也 
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可 以 用 来 简化 文件 路 径 或 URL 的 输入 ,请 参考 第 4 章 的 内 容 。 
1.4.5 运算 符 与 表达 式 


与 其 他 语言 一 样 ,Python 支持 大 多 数 算术 运算 符 、 关 系 运算 符 、 逻 辑 运算 符 以 及 位 运算 
符 。 除 此 之 外 ,还 有 一 些 运算 符 是 Python 特有 的 ,例如 成 员 测 试 运算 符 、 集 合 运算 符 、 同 一 
性 测试 运算 符 等 ,Python 常用 运算 符 如 表 1-5 所 示 。 


表 1-5 Python 常用 运算 符 


运算 符 示例 功能 说 明 
x 十 y 算术 加 法 ,列表 、 元 组 .字符 串 合 并 
x—y 算术 减法 ,集合 差 集 
x*y 乘法 ,序列 重复 
x/y 除法 
x//y 求 整 商 
—x 负数 
x%y 余数 /格式 化 (对 实数 可 以 进行 余数 运算 ) 
xy 等 运算 
x<ysx<=yix>yix>=y 大 小 比较 ,集合 的 包含 关系 比较 
x==ysxl=y 相等 比较 ( 值 ) ,不 等 比较 
xory 逻辑 或 (只 有 x 为 假 才 会 计算 y) 
xandy 逻辑 与 (只 有 x 为 真 才 会 计算 y) 
not x 逻辑 非 
x in yix not in y 成 员 测 试 运算 符 
xis yixis not y 对 象 实体 同一 性 测试 (地 址 ) 
[Re Sh pe ee 位 运算 符 
&..] 集合 交集 .并 集 


需要 说 明 的 是 ,Python 中 的 除法 有 两 种 ./ 和 // 分 别 表 示 除 法 和 整除 运算 ,并 且 Python 2 
和 Python 3 对 这 两 种 运算 符 的 解释 也 略 有 区 别 ,例如 ,在 Python 3.4. 2 中 运算 结果 如 下 : 


>>>3/5 
0.6 
>>>3//5 
0 
>>>3.0/5 
0.6 
>>>3.0//5 
0.0 
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而 在 Python 2. 7. 8 中 运算 结果 如 下 : 


>>>3/5 

0 

>>>3//5 

0 
>>>3.0/5 
0.6 
>>>3.0//5 
0.0 


另外 一 个 需要 说 明 的 ,也 是 与 其 他 有 些 语言 略 有 不 同 的 运算 符 是 %。 在 Python 中 , 除 


去 前 面 已 经 介绍 过 的 字符 串 格 式 化 用 法 之 外 ,该 运算 符 还 可 以 对 整数 和 浮 点 数 计算 余数 。 
但 是 由 于 浮 点 数 的 精确 度 的 影响 ,计算 结果 可 能 略 有 误差 ,例如 : 


>>>3.1%2 

1.1 

>>> 6.3%2.1 
2.0999999999999996 
>>> 682 

0 

>>> 6.082 

0.0 

>>> 6.0%2.0 

0.0 

>>> 5.7%4.8 
0.9000000000000004 


如 前 所 述 ,Python 中 很 多 运算 符 有 多 重 含义 ,在 程序 中 运算 符 的 具体 含义 取决 于 操作 


数 的 类 型 。 例 如 ,* 运算 符 就 是 Python 运算 符 中 比较 特殊 的 一 个 , 它 不 仅 可 以 用 于 数值 乘 
法 ,还 可 以 用 于 列表 、 字 符 串 、 元 组 等 类 型 , 当 列表 、 字 符 串 或 元 组 等 类 型 变量 与 整数 进行 * 
运算 时 ,表示 对 内 容 进行 重复 并 返回 重复 后 的 新 对 象 。 例 如 : 


>>>3x 2 # 整 数 相 乘 

6 

>>>2.0* 3 # 浮 点 数 与 整数 相 乘 
6.0 

>>> (3+4j) * 2 # 复 数 与 整数 相 乘 
(6*83) 

>>> (3443) * (3-45) # 复 数 与 复数 相 乘 
(25+ 03) 

>>>'1'*5 # 字 符 串 重复 
"11111' 

»»»"a"* 10 # 字 符 串 重复 
'aaaaaaaaaa" 

»[1,2,3] * 3 LEES 


(1, 2, 3, 1, 2, 3, 1, 2, 3] 
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>>> (1,2,3) * 3 TAER 
(15, 2,35, Pe 2,3, 13, 2; 3) 
>>>3x "ar # 字 符 串 重复 


在 Python 中 ,单个 任何 类 型 的 对 象 或 常数 属于 合法 表达 式 , 使 用 表 1-5 中 运算 符 连 接 
的 变量 和 常量 以 及 函数 调用 的 任意 组 合 也 属于 合法 的 表达 式 。 例 如 : 


>>>a = [1,2,3] 

>>>b = [4,5,6] 

>>>c =atb 

>>>c 

[1, 2, 3, 4, 5, 6] 

»»»d =map (str, c) 

>>>d 

SP Gr] 

>>> import math 

>>>map (math.sin, c) 

[0.8414709848078965, 0.9092974268256817, 0.1411200080598672, - 0.7568024953079282, 
— 0.9589242746631385, - 0.27941549819892586] 
>>> 'Hello' +' ' + 'world' 

'Hello world" 

>>> 'welcome ' * 3 

"welcome welcome welcome ' 

>>> ('welcome, '* 3).rstrip(',')* '!" 


"welcome, welcome, welcome!" 


14.6 常用 内 置 函数 

内 置 函 数 是 指 不 需要 导入 任何 模块 即 可 直接 使 用 的 函数 ,例如 ,在 1.4.5 节 中 最 后 的 例 
子 中 用 到 的 map() 函 数 即 属于 Python 内 置 函数 ,因此 不 需要 导入 任何 模块 就 可 以 直接 使 
用 ,该 函数 在 本 书后 面 会 有 讲解 ,当然 读者 也 可 以 直接 跳 至 第 5 章 进 行 阅读 ,或 者 使 用 help 
(map) 来 查看 该 函数 帮助 文档 进行 学 习 。 

执行 下 面 的 命令 可 以 列 出 所 有 内 置 函 数 : 

»»»dir( builtins ) 

Python 常用 的 内 置 函 数 及 其 功能 简要 说 明 如 表 1-6 所 示 。 

表 1-6 Python 常用 内 置 函 数 及 其 功能 简要 说 明 


函数 功能 简要 说 明 
abs(x) 返回 数字 x 的 绝对 值 
bin(x) 把 数字 x 转换 为 二 进 制 串 
chr(x) 返回 ASCI 编码 为 x 的 字符 
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PA 数 功能 简要 说 明 
dirO 返回 指定 对 象 的 成 员 列表 
eval(s[，globals[，locals]]) 计算 字符 串 中 表达 式 的 值 并 返回 
float(x) 把 数字 或 字符 串 x 转换 为 浮 点 数 并 返回 
help(obj) 返回 对 象 obj 的 帮助 信息 
hex(x) 把 数字 x 转换 为 十 六 进 制 串 
id(obj) 返回 对 象 obj 的 标识 (地 址 ) 
input[ 提 示 内 容 字符 串 ]) aaa a eee 
len(obj) 返回 对 象 obj 包含 的 元 素 个 数 ,适用 于 列表 、 元 组 、 集 合 、 字 典 和 

字符 串 等 类 型 的 对 象 

oct(x) 把 数字 x 转换 为 八进制 串 
ord(s) 返回 1 个 字符 s 的 编码 


range([start, ] end [, step] ) 


返回 一 个 等 差 数列 (Python 3 中 返回 一 个 range 对 象 ), 不 包括 终 值 


round(x [， 小 数位 数 ]) 


对 x 进行 四 舍 五 入, 若 不 指定 小 数位 数 , 则 返回 整数 


str(obj) 


把 对 象 obj 转换 为 字符 串 


int(x[ ,dj) 


返回 数字 的 整数 部 分 ,或 把 d 进 制 的 字符 串 x 转换 为 十 进 制 并 
返回 ,d 默认 为 十 进 制 


list(x) 、 set([obj]) .tuple(x) 


把 对 象 转换 为 列表 、 集 合 或 元 组 并 返回 


max(x), min(x)、 sum(x) 


返回 序列 中 的 最 大 值 ` 最 小 值 或 数值 元 素 之 和 


pow(x,y) 返回 x 的 y 次 方 

sorted( 列 表 [ ,cmp[ ,key[Lreverse]]] | 返回 排序 后 的 列表 

type(obj) 返回 对 象 obj 的 类 型 

reversed( 列 表 或 元 组 ) 返回 逆序 后 的 列表 或 迭代 器 对 象 

map( 函 数 ,序列 ) 将 单 参数 函数 映射 至 序列 中 的 每 个 元 素 ,返回 结果 列表 


reduce( 函 数 ,序列 ) 


将 接收 2 个 参数 的 函数 以 累积 的 方式 从 左 到 右 依次 应 用 至 序列 
中 每 个 元 素 ,最 终 返 回 单个 值 作为 结果 


由 于 内 置 函 数 众多 且 功 能 强大 ,很 难 一 下 子 全 部 解释 清楚 ,本 书 将 根据 内 容 组 织 的 需要 
逐步 展开 演示 其 用 法 。 这 里 只 通过 几 个 例子 来 演示 部 分 内 置 函 数 的 使 用 ,如 果 读 者 需要 用 
到 某 个 内 置 函数 而 还 没有 看 到 本 书后 面 的 讲解 .可 以 通过 内 置 函 数 help() 查 看 函数 的 使 用 
帮助 ,提前 进行 学 习 。 

建议 : 编写 程序 时 应 优先 考虑 使 用 内 置 函数 ,因为 内 置 函 数 不 仅 成 熟 、 稳 定 ,而 且 速 度 
相对 较 快 。 

ord O All chr() 是 一 对 功能 相反 的 函数 ,ord() 用 来 返回 单个 字符 的 序数 或 ASCI 码 ,而 
chr() 则 用 来 返回 介 于 0 一 255 之 间 的 某 序数 对 应 的 字符 ,str() 则 直接 将 其 参数 转换 为 字符 
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串 。 例 如 : 


»»»ord('a') 

97 

»»»ord('A') 

65 

>>> chr (65) 

"AC 

>>> chr (67) 

"cr 

>>> chr (ord ('A')* 1) 
"B 

»»»str(1) 

ut 

>>> str (1234) 
"1234" 

>>> str ([1,2,3]) 
* 3,2, 35" 
»»»str((1,2,3)) 
*(3,.2, 3)* 
»»»str((1,2,3)) 
'set([1, 2, 3])' 


maxO ,minO ,sum O3X 3 A VÀ Sf PRE SUL] T TEE 9 BS, 26 2H 2X HC fib nT 3 (NOE S rh TT 
有 元 素 最 大 值 . 最 小 值 以 及 所 有 元 素 之 和 ,sum() 只 支持 数值 型 元 素 的 序列 或 可 和 迭代 对 象 ， 
max O fll min() 则 需要 序列 或 可 迭代 对 象 中 的 元 素 之 间 可 比较 大 小 。 例 如 ,下 面 的 示例 代 
码 ,首先 使 用 列表 推导 式 生 成 包含 10 个 随机 数 的 列表 ,然后 分 别 计算 该 列表 的 最 大 值 .最 小 
值 和 所 有 元 素 之 和 : 


>>> import random 

>>>a = [random.randint (1,100) for i in range (10)] 
>>>a 

[72, 26, 80, 65, 34, 86, 19, 74, 52, 40] 

>>>print (max (a) ,min (a) , sum(a)) 

86 19 548 


很 显然 ,如 果 需 要 计算 该 列表 中 的 所 有 元 素 的 平均 值 ,可 以 使 用 下 面 的 方法 : 


>>>a = [72, 26, 80, 65, 34, 86, 19, 74, 52, 40] 
»»»sum(a) * 1.0/1en (a) # Python 2.7.8 
54.8 


对 于 初学 者 而 言 ,也 许 dirO All helpO 3x Pj A BCE IY. BE dirO PA BO WA 
指定 模块 中 包含 的 所 有 成 员 或 者 指定 对 象 类 型 所 支持 的 操作 ,而 help( 〇 函数 则 返回 指定 模 
块 或 函数 的 说 明文 档 , 这 对 于 了 解 和 学 习 新 的 模块 与 知识 是 非常 重要 的 ,能 够 熟练 使 用 这 两 
个 函数 也 是 学 习 能 力 的 重要 体现 。 

下 面 的 代码 首先 导入 数学 模块 math, 然 后 查看 该 模块 的 常量 和 函数 ,并 查看 指定 函数 
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>>> import math 
>>> dir (math) ## 查 看 模块 中 的 可 用 对 象 
[doc ',' loader ',' name ',' package ', ' spec 


*, 'acos', 'acosh', 


asin', 'asinh', 'atan', 'atan2', 'atanh', 'ceil', 'copysign', 'cos', 'cosh', 
'degrees', 'e', 'erf', 'erfc', 'exp', 'expml', 'fabs', 'factorial', 'floor', 
'fmod', 'frexp', 'fsum', 'gamma', 'hypot', 'isfinite', 'isinf', 'isnan', 'ldexp', 


"lgamma', 'log', 'loglO', 'loglp', 'log2', 'modf', 'pi', 'pow', 'radians', 'sin', 
'sinh', 'sqrt', 'tan', 'tanh', 'trunc'] 


»»»dir(3*4j) # 查 看 数字 类 型 成 员 
[' abs ' add ',' class '，' coerce ',' delattr ',' div ',' diwmd ', 
" doc ',"' eq '," float ','" floordiv "'," format ',"' ge ', 


' getattribute ^", ' getnewargs ', ' gt ','"' hash ','' init "','' int ', 
' le '," log ',' dt ',' md ',' ml ',' me ',' neg ',' mew ', 


"nonzero", * pos ",'" pow '," radd *," rdiv "','"' rdivmod ", 
' reduce ',' reduce ex ', ' repr ',' rfloordiv ',' mod ',"' mul ', 


' rpow ','" rsub ',' rtruediv "', '' setattr_', ' sizeof ','' str ', 


"sub ' subclasshook ', ' truediv ', 'conjugate', 'imag', 'real'] 
»»»dir('!) # 查 看 字符 串 类 型 成 员 
[' add ',' class ',' contains ",' delattr 2， doc ','' eq ', 


' format ',' ge ','' getattribute ',' getitem_', ' getnewargs ', 


' getslice ',' gt ',' hash ', ' init ',' le ',"' len ', ' ijt ', 
'! mod ',' ml ',' ne ',' new ',' reduce ',' reduce ex ',' repr ', 
' md ',' ml ',' setattr ', ' sizeof ',' str ',"' subclasshook ', 


' formatter field name split', ' formatter parser', 'capitalize', 'center', 
'count', 'decode', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'index', 
'isalnum', 'isalpha', 'isdigit', 'islower', 'isspace', 'istitle', 'isupper', 
'join', 'ljust', 'lower', 'lstrip', 'partition', 'replace', 'rfind', 'rindex', 
'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 


'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill'] 


>>> help (math. sqrt) # 查 看 指定 方法 的 使 用 帮助 
Help on built- in function sqrt in module math: 
sqrt (=) 

sqrt (x) 


Return the square root of x. 
>>>help (math. sin) 
Help on built- in function sin in module math: 
sin(…) 

sin(x) 


Return the sine of x (measured in radians). 


1.4.7 对 象 的 删除 


正如 前 面 所 提 到 的 ,在 Python 中 具有 自动 内 存 管理 功能 ,Python 解释 器 会 跟踪 所 有 的 


值 , 一 旦 发 现 某 个 值 不 再 有 任何 变量 指向 ,将 会 自动 删除 该 值 。 尽 管 如 此 ,自动 内 存 管理 或 
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者 垃圾 回收 机 制 并 不 能 保证 及 时 释放 内 存 。 显 式 释 放 自 己 申请 的 资源 是 程序 员 的 好 习惯 之 
一 ,也 是 程序 员 素 养 的 重要 体现 之 一 。 

在 Python 中 ,可 以 使 用 del 命令 来 删除 对 象 并 解除 与 值 之 间 的 指向 关系 。 删 除 对 象 
时 ,如 果 其 指向 的 值 还 有 别 的 变量 指向 则 不 删除 该 值 , 如 果 删 除 对 象 后 该 值 不 再 有 其 他 变量 
指向 , 则 删除 该 值 。 例 如 下 面 的 代码 所 演示 : 


>>>x = [1,2,3,4,5,6] 
>>>y =3 
>>>z=y 
>>>print (y) 
3 
»»»dely # 删 除 对 象 
>>>print (y) 
Traceback (most recent call last): 
File "<pyshell# 52>", line 1, in <module> 
print (y) 
NameError: name 'y' is not defined 
>>>print (z) 
3 
>>>del z 
>>>print (z) 
Traceback (most recent call last): 
File "<pyshell# 56>", line 1, in <module> 


print (z) 
NameError: name 'z' is not defined 
>>>del x[1] # 删 除 列表 中 指定 元 素 
>>>print (x) 
[1, 3, 4, 5, 6] 
>>> del x # 删 除 整个 列表 
>>> print (x) 


Traceback (most recent call last): 
File "<pyshell# 60>", line 1, in «module» 
print (x) 

NameError: name 'x' is not defined 

正如 运行 结果 所 示 ,变量 y 和 z 指 向 同一 个 值 ,删除 变量 y 以 后 该 值 仍 存在 且 被 z 所 指 
向 。 另 外 ,del 可 以 用 来 删除 列表 或 其 他 可 变 序 列 中 的 指定 元 素 , 也 可 以 删除 整个 列表 或 其 
他 类 型 序列 对 象 。 列 表 中 部 分 元 素 删除 以 后 ,列表 会 自动 收缩 其 内 存 空 间 以 保证 各 元 素 连 
续 存储 ,这 在 后 面 第 2 章 会 详细 介绍 。del 无 法 删除 元 组 或 字符 串 中 的 指定 元 素 ,而 只 可 以 
删除 整个 元 组 或 字符 串 ,因为 这 两 者 均 属 于 不 可 变 序列 。 

>>>x = (1,2,3) 

>>>del x[1] 


Traceback (most recent call last): 
File "<pyshell# 62>", line 1, in «module» 
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del x[1] 
TypeError: 'tuple' object doesn't support item deletion 
>>>del x 
>>>print (x) 
Traceback (most recent call last): 

File "<pyshell# 64>", line 1, in «module» 

print (x) 

NameError: name 'x' is not defined 


8 基本 输入 输出 
用 Python 进行 程序 设计 ,输入 是 通过 input O 函数 来 实现 的 ,input() 的 一 般 格式 为 
xinput(" 提 示 : ') 


该 函数 返回 用 户 输入 的 对 象 。 
尽管 形式 一 样 ,Python 2 和 Python 3 对 该 函数 的 解释 略 有 不 同 。 在 Python 2 中 ,该 函 
回 结 果 的 类 型 由 输入 值 时 的 界定 符 来 决定 ,例如 下 面 的 Python 2. 7. 8 代码 : 


>>>x =input ("Please input:") 

Please input:3 # 没 有 界定 符 ,整数 
»»»print type (x) 

«type 'int'» 

>>>x =input ("Please input:") 

Please input:'3" # 单 引号 ,字符 串 
>>>print type (x) 

<type 'str'> 

>>>x =input ("Please input:") 

Please input: [1,2,3] # 方 括号 ,列表 
>>>print type (x) 

«type 'list'> 


在 Python 2 中 ,还 有 一 个 raw_input() 函 数 用 来 接收 用 户 输入 的 值 ,该 函数 返回 结果 的 


类 型 一 律 为 字符 串 ,而 不 管用 户 使 用 什么 界定 符 。 例 如 : 


>>>x =raw input ("Please input:") 
Please input: [1,2,3] 

>>>print type (x) 

«type 'str'> 


在 Python 3 中 ,不 存在 raw. inputO PARK. ifi] input() 函 数 的 返回 结果 是 字符 串 , 需 要 将 


其 转换 为 相应 的 类 型 再 处 理 , 相 当 于 Python 2 中 的 raw_input( 〇 函数 。 例 如 : 
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>>>x —input('Please input:') 
Please input:3 

»»» print (type (x) ) 

<class 'str'> 


>>>x = input ("Please input:') 
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Please input:'1" 

>>> print (type (x) ) 

«class 'str'» 

>>>x =input ('Please input:') 

Please input: [1,2,3] 

>>> print (type (x) ) 

<class 'str'> 

>>>x =raw_input ("Please input:') 

Traceback (most recent call last): 

File "<pyshell# 83>", line 1, in «module» 
x =raw_input ("Please input:') 

NameError: name 'raw input' is not defined 

Python 2 和 Python 3 的 输出 方法 也 不 完全 一 致 。 在 Python 2 中 ,使 用 print 语句 进行 
输出 ,而 在 Python 3 中 使 用 printO 函数 进行 输出 ,上 面 的 例子 已 经 说 明了 这 个 区 别 。 在 本 
书 第 一 篇 后 面 章节 中 给 出 的 代码 中 ,大 部 分 是 在 Python 3. 4. 2 环境 下 编写 的 ,而 第 二 篇 由 
于 用 到 了 一 些 暂 时 还 不 支持 Python 3 的 扩展 库 , 因 此 有 些 代码 是 使 用 Python 2. 7. 8 编写 
的 。 当 您 偶尔 遇 到 某 个 代码 中 使 用 print 语句 进行 输出 的 话 , 我 想 您 会 明白 原因 的 ,并 且 也 
知道 如 何 根据 您 安装 的 Python 版 本 进行 适当 的 改写 。 

默认 情况 下 ,Python 将 结果 输出 到 IDLE 或 者 标准 控制 台 ,在 输出 时 也 可 以 进行 重 定 
向 ,例如 可 以 把 结果 输出 到 指定 文件 。 在 Python 2. 7. 8 中 使 用 下 面 的 方法 进行 输出 重 
定向 : 

>>> fp =open(r'C:\mytest.txt', 'at') 

>>>print >>fp, "Hello,world" 

>>> fp.close () 


而 在 Python 3. 4. 2 中 则 需要 使 用 下 面 的 方法 进行 重 定向 : 


>>> fp -open(r'D:Wnytest.txt', 'at') 

>>>print ('Hello,world!', file —fp) 

»»»fp.close() 

另外 一 个 重要 的 不 同 是 ,对 于 Python 2 而 言 , 在 print 语句 之 后 加 上 逗号 (,) 则 表示 输 
出 内 容 之 后 不 换行 ,例如 : 

>>> for i in range (10) : 

print i, 
0123456789 


在 Python 3 中 ,为 了 实现 上 述 功能 则 需要 使 用 下 面 的 方法 : 


>>> for i in range (10,20) : 
print(i, end-' ') 
10 11 12 13 14 15 16 17 18 19 
在 这 两 个 示例 中 ,rangeO) 是 内 置 函数 ,用 来 生成 一 个 列表 或 迭代 对 象 ,相信 您 已 经 明白 
该 函数 的 基本 用 法 ,更 加 详细 和 巧妙 的 用 法 会 在 后 面 逐 步 展 开 。 
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Python 默认 安装 仅 包 含 部 分 基本 或 核心 模块 ,但 用 户 可 以 很 方便 地 安装 大 量 的 扩展 模 
块 ,pip 是 管理 扩展 模块 的 重要 工具 。 同 样 f£ Python 启动 时 ,也 仅 加 载 了 很 少 的 一 部 分 模 
块 ,在 需要 时 由 程序 员 显 式 地 加 载 ( 有 些 模块 可 能 需要 先 安装 ) 其 他 模块 。 这 样 可 以 减 小 程 
序 运行 的 压力 , 仅 加 载 真正 需要 的 模块 和 功能 ,上 且 具 有 很 强 的 可 扩展 性 。 可 以 使 用 sys. 
modules. items() 显 示 所 有 预 加 载 模块 的 相关 信息 。 

正如 上 面 所 述 ,对 于 很 多 模块 而 言 , 需 要 首先 导入 .然后 才能 使 用 其 中 的 对 象 。Python 
中 主要 有 以 下 两 种 导入 模块 的 方法 。 

1. import 模块 名 [as 别名 ] 

使 用 这 种 方式 导入 模块 以 后 ,需要 在 要 使 用 的 对 象 之 前 加 上 前 级 , 即 以 “模块 名 . 对 象 
名 ”的 方式 进行 访问 。 也 可 以 为 导入 的 模块 设置 一 个 别名 ,然后 使 用 “别名 . 对 象 名 ”的 方式 
来 访问 其 中 的 对 象 。 


>>> import math 

>>>math.sin(0.5) # 求 0.5 的 正弦 值 
0.479425538604203 

>>> import random 

»»»x = random. random () # 获 得 [0,1) 内 的 随机 小 数 
>>>x 

0.7866224717141462 

>>> y =random.random( 

>>>y 

0.21054341257255382) 

>>>n = random.randint (1,100) # 获 得 [1,100] 上 的 随机 整数 
>>>n 

82 

>>> import numpy as np # 导 人 模块 并 设置 别名 
>>>a -np.array((1,2,3,4)) # 通 过 模块 的 别名 来 访问 其 中 的 对 象 
>>>print a 

[1234] 


2. from 模块 名 import 对 象 名 [ as 别名 ] 

使 用 这 种 方式 仅 导 入 明确 指定 的 对 象 , 并 且 可 以 为 导入 的 对 象 起 一 个 别名 。 这 种 导入 
方式 可 以 减少 查询 次 数 ,提高 访问 速度 ,同时 也 减少 了 程序 员 需 要 输入 的 代码 量 ,而 不 需要 
使 用 模块 名 作为 前 级 。 例 如 : 


>>> from math import sin 
>>> sin (3) 

0.1411200080598672 

>>> from math import sin as f 
»f(3) 

0.141120008059867 
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比较 极端 的 情况 是 一 次 导入 模块 中 的 所 有 对 象 ,例如 : 
from math import * 


使 用 这 种 方式 固然 简单 省 事 ,但 是 并 不 推荐 使 用 ,一 旦 多 个 模块 中 有 同名 的 对 象 , 这 种 
方式 将 会 导致 混乱 。 

有 时 候 在 测试 自己 编写 的 模块 时 ,可 能 需要 频繁 地 修改 代码 并 重新 导入 模块 ,在 
Python 2 中 可 以 使 用 reload() 函 数 重新 导入 一 个 模块 ,而 在 Python 3 中 ,需要 使 用 imp Ei 
块 的 reload O PR C, 

在 导入 模块 时 ,Python 首先 在 当前 目录 中 查找 需要 导入 的 模块 文件 ,如 果 没 有 找到 则 
从 sys 模块 的 path 变量 所 指定 的 目录 中 查找 ,如 果 仍 没有 找到 模块 文件 则 提示 模块 不 存 
在 。 可 以 使 用 sys 模块 的 path 变量 查看 Python 导入 模块 时 搜索 模块 的 路 径 , 也 可 以 使 用 
append() 方 法 向 其 中 添加 自 定义 的 目录 以 扩展 搜索 路 径 。 在 导入 模块 时 ,会 优先 导入 相应 
的 . pyc 文件 ,如 果 相 应 的 . pyc 文件 与 . py 文件 时 间 不 相符 或 不 存在 对 应 的 . pyc 文件 , 则 导 
入 .py 文件 并 重新 将 该 模块 文件 编译 为 . pyc 文件 。 关 于 Python 文件 名 的 详细 介绍 请 参考 
1.6 节 的 内 容 。 

近年 来 ,大 量 用 于 不 同 领域 和 专业 的 Python 扩展 库 不 断 涌现 ,下 面 仅仅 列 出 了 其 中 很 
小 的 一 部 分 。 

COD os: 跨 平台 的 操作 系统 模块 ,支持 文件 与 文件 夹 以 及 其 他 相关 操作 。 

(2) sys: 提供 了 与 解释 器 使 用 和 维护 有 关 对 象 的 接口 。 

(3) math; 提供 了 常用 的 数学 函数 。 

(A) Locale; 提供 了 C 语 言 本 地 化 函数 的 接口 ,并 提供 相关 函数 实现 基于 当前 locale iz 
置 的 数字 与 字符 串 转 换 。 

(5) random: 提供 了 随机 数 生成 函数 以 及 随机 化 有 关 的 函数 。 

(6) pickle: 支持 序列 化 功能 。 

(7) datetime: 支持 日 期 时 间 有 关 功 能 。 

(8) time; 支持 时 间 统 计 与 测试 有 关 功能 。 

(9) wmi: Windows 管理 接口 , 需 单独 安装 。 

(10) tkinter: GUI 开发 支持 。 

(11) urllib/urllib2; 网 页 读 取 与 访问 。 

(12) Pygame: 游戏 开发 模块 。 

(13) wxPython: GUI 编程 。 

(14) SciPy: 科学 计算 模块 。 

(15) PIL: 图 像 处 理 模块 。 

(16) fabric: 远程 操作 与 部 署 。 

(17) capstone: 反 汇 编 框架 。 

(18) ropper: ROP 相关 框架 。 

(19) IDAPython: IDA 插件 ,使 得 Python 程序 可 以 运行 于 IDA 中 以 实现 可 执行 文件 
的 自 定 义 分 析 。 

(20) Yara: 恶意 软件 识别 与 分 类 引擎 。 
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1.5 Python 代码 编写 规范 


(1) 缩 进 。 

Python 程序 依靠 代码 块 的 缩 进 来 体现 代码 之 间 的 逻辑 关系 。 对 于 类 定义 、 函 数 定义 、 
选择 结构 、 循 环 结构 以 及 异常 处 理 结构 来 说 , 行 尾 的 冒号 以 及 下 一 行 的 缩 进 表示 一 个 代码 块 
的 开始 ,而 缩 进 结束 就 表示 一 个 代码 块 结束 了 。 在 编写 程序 时 ,同一 个 级 别 的 代码 块 的 缩 进 
量 必须 相同 。 

在 IDLE 开发 环境 中 ,一 般 以 4 个 空格 为 基本 缩 进 单位 ,或 者 使 用 下 面 的 方式 来 修改 基 
本 缩 进 量 ,如 图 1-7 所 示 。 
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图 1-7 IDLE 环境 中 基本 缩 进 量 的 设置 


编写 程序 时 ,可 以 通过 下 面 的 菜单 进行 代码 块 的 批量 缩 进 和 反 缩 进 : 
Fortmat-*Indent Region/Dedent Region 


当然 ,也 可 以 使 用 快捷 键 Ctrl 十 ] 进 行 缩 进 ,使 用 快捷 键 Ctrl 十 [进行 反 缩 进 。 

(2) 注释 。 

据 统计 ,一 个 好 的 可 维护 性 和 可 读 性 都 很 强 的 程序 一 般 包含 30% 以 上 的 注释 ,注释 对 
于 程序 理解 和 团队 合作 开发 具有 非常 重要 的 意义 。Python 中 常用 的 注释 方式 主要 有 两 种 。 

(D 以 # 开 始 ,表示 本 行 熙 之 后 的 内 容 为 注释 。 

@ 包含 在 一 对 三 引号 "…" 或 """…""" 之 间 且 不 属于 任何 语句 的 内 容 将 被 解释 器 认为 
是 注释 。 

在 IDLE 开发 环境 中 ,可 以 通过 下 面 的 操作 快速 注释 /解除 注释 代码 块 : 
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Format—Comment Out Region/Uncomment Region 


或 者 也 使 用 快捷 键 Alt 十 3 和 Alt 十 4 进行 代码 块 的 批量 注释 和 解除 注释 。 

(3) 每 个 import 语句 只 导入 一 个 模块 ,尽量 避免 一 次 导入 多 个 模块 。 

(4) 如 果 一 行 语句 太 长 ,可 以 在 行 尾 使 用 续 行 符 \ 来 表示 下 面 紧 接 的 一 行 仍 属 于 当前 语 
句 ,但 是 一 般 建议 使 用 括号 来 包含 多 行内 容 。 

(5) 使 用 必要 的 空格 与 空 行 增强 代码 的 可 读 性 。 运 算 符 两 侧 、 函 数 参数 之 间 、 逗 号 两 侧 
建议 使 用 空格 进行 分 隔 , 而 不 同 功能 的 代码 块 之 间 、 不 同 的 函数 定义 以 及 不 同 的 类 定义 之 间 
则 建议 增加 一 个 空 行 以 增加 可 读 性 。 

(6) 适当 使 用 异常 处 理 结构 提高 程序 容错 性 ,但 不 能 过 多 依赖 异常 处 理 结构 。 

CO 软件 应 具有 较 强 的 可 测试 性 ,测试 与 开发 齐头并进 。 

下 面 的 代码 可 以 用 来 检查 Python 程序 的 规范 性 ,当然 也 可 以 在 此 基础 上 继续 完善 。 


#- * -coding:utf-8 - * — 
# Filename: CheckCodeFormats.py 
import sys,re 


def checkFormats (lines, desFileName): 


fp =open (desFileName, 'w') 


for i, line in enumerate (lines): 
print '-'* 30 


print 'Line:', i+1 


if line.strip().startswith('£ '): 
print ' '* 10+ 'Pass." 
fp.write (line) 


continue 


flag -True 


# check operator symbols 
symbols — [*,*, "+", "=t, !& t, 1/4, 1/4, 1 Ih, III, ICI, ent, ou, 
"emt '/='] 
temp line -line 
for symbol in symbols: 
pattern =re.compile(r'\s* '4re.escape (symbol)+r'\s* ') 
temp line =pattern.split (temp_line) 
sep-' 'tsymbol+' ' 
temp line -sep.join(temp line) 
if line !-temp line: 
flag =False 
print ' '* 10+ 'You may miss some blank spaces in this line.' 
line -temp line 
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# check import statement 
if line.strip().startswith('import'): 
if "'," in line: 
flag =False 
print ' '* 10+ "You'd better import one module at a time." 
temp line -line.strip() 
modules -temp line[temp line.index(' ')+1:] 
modules —modules.strip() 
pattern =re.compile(r'\s* ,\s* ') 
modules =pattern. split (modules) 
temp line-'" 
for module in modules: 
temp line *- line[:line.index('import')]* 'import '+module+ '\n' 
line -temp line 


pri line -lines[i-1].strip() 
if pri line and (not pri line.startswith('import')) and V 
(not pri line.startswith('$ ')): 
flag -False 
print ' '* 10+ 'You should add a blank line before this line." 


line = '\n'+ line 


after line =lines[i+1].strip() 
if after line and (not after line.startswith('import')): 
flag -False 
print ' '* 10+ 'You should add a blank line after this line." 


line -line* '\n' 


#check if there is a blank line before new funtional code block, including the class/ 
function definition 
if line.strip() and not line.startswith(' ') and i >0: 
pri line -lines[i- 1] 
if pri line.strip() and pri line.startswith(' '): 
flag =False 
print ' '* 10+ "You'd better add a blank line before this line." 


line ='\n'+ line 


if flag: 
print ' '* 10 + 'Pass.' 
fp.write (line) 
fp.close() 
if name --' main ': 


fileName = 'CheckCodeFormats .py'# sys.argv[1] 
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fileLines = [] 
with open(fileName, 'r') as fp: 
fileLines =fp.readlines () 
desFileName —fileName[:-3]* ' new.py' 
checkFormats (fileLines, desFileName) 


# check the ratio of comment lines to all lines 
comments = [line for line in fileLines if line.strip().startswith('$ ')] 
ratio = len (comments) * 1.0/len (fileLines) 
if ratio <=0.3: 
print '='* 30 
print 'Comments in the file is less than 30%.' 


print 'Perhaps you should add some comments at appropriate position." 


1.6 Python 文件 名 


在 Python 中 ,不同 扩 展 名 的 文件 有 不 同 的 含义 和 用 途 , 常 见 的 扩展 名 主要 有 以 下 5 种 。 

(1) py: Python 源 文件 ,由 Python 解释 器 负责 解释 执行 。 

(2) pyw: Python 源 文件 ,常用 于 图 形 界面 程序 文件 。 

(3) pyc: Python 字 节 码 文件 ,无 法 使 用 文本 编辑 器 正常 查看 文件 内 容 。 对 于 Python 
模块 ,第 一 次 被 导入 时 将 被 编译 成 字 节 码 的 形式 ,并 在 以 后 再 次 导入 时 优先 使 用 pyc 文件 ， 
以 提高 模块 的 加 载 和 和 运行 速度 。 对 于 非 模块 文件 ,直接 执行 时 并 不 生成 pyc 文件 ,但 可 以 使 
用 py_compile 模块 的 compile() 函数 进行 编译 以 提高 加 载 和 和 运行 速度 。 

(4) pyo: 优化 的 Python 字 节 码 文 件 , 同 样 无 法 使 用 文本 编辑 器 正常 查看 其 内 容 。 可 
Vili FA“ python -O -m py-compile file. py” 或 “python -OO -m py-compile file. py” 进 行 优化 
编译 。 

(5) pyd: 一 般 是 由 其 他 语言 编写 并 编译 的 二 进 制 文件 ,常用 于 实现 某 些 软件 工具 的 
Python 编程 接口 或 Python 动态 链接 库 。 


1.7 Python 程序 的 运行 方式 


每 个 Python 脚本 在 运行 时 都 有 一 个 _name_ 属性。 如 果 脚 本 作为 模块 被 导入 , 则 其 
_name_ 属 性 的 值 被 自动 设置 为 模块 名 ;如 果 脚 本 独立 运行 , 则 其 _name_ 属 性 值 被 设置 
为 '_ main_'。 

利用 该 属性 即 可 控制 Python 程序 的 某 些 行 为 。 例 如 ,编写 一 个 包含 大 量 可 被 其 他 程 
序 利用 的 函数 的 模块 ,而 不 希望 该 模块 可 以 直接 运行 , 则 可 以 在 程序 文件 中 添加 如 下 代码 : 


if name --' main ': 


print 'Please use me as a module." 


这 样 一 来 ,程序 直接 执行 时 将 会 得 到 提示 “Please use me as a module. ”, 而 使 用 import 
语句 将 其 作为 模块 导入 后 可 以 使 用 其 中 的 函数 或 其 他 成 员 。 


《Python 程序 设计 》 


— 28 


1.8 编写 自己 的 包 


包 是 Python 用 来 组 织 命名 空间 和 类 的 方式 ,可 以 看 作 是 包含 大 量 Python 程序 模块 的 文 
件 夹 。 在 包 的 每 个 目录 中 都 必须 包含 一 个 _init_. py 文件 ,该 文件 可 以 是 一 个 空 文件 , 仅 用 于 
表示 该 目录 是 一 个 包 。_init_. py 文件 的 主要 用 途 是 设置 _all 变量 以 及 执行 初始 化 包 所 需 
的 代码 ,其 中 _all_ 变量 中 定义 的 对 象 可 以 在 使 用 from …import * 时 全 部 被 正确 导入 。 

假设 有 如 下 结构 的 包 : 


sound/ Top- level package 
. init .py Initialize the sound package 
formats/ Subpackage for file format conversions 
. init__.py 
wavread.py 
wavwrite.py 
aiffread.py 


aiffwrite.py 
auread.py 


auwrite.py 


effects/ Subpackage for sound effects 
. init .py 
echo.py 
surround.py 


reverse.py 


filters/ Subpackage for filters 
. init .py 
equalizer.py 
vocoder.py 
karaoke.py 


那么 ,就 可 以 在 自己 的 程序 中 使 用 下 面 的 代码 导入 其 中 一 个 模块 : 
import sound.effects.echo 

然后 使 用 完整 名 字 来 访问 或 调用 其 中 的 成 员 , 例 如 : 
sound.effects.echo.echofilter (input, output, delay=0.7, atten=4) 


或 者 参考 1. 4. 9 节 中 介绍 的 使 用 模块 成 员 的 方法 来 访问 该 模块 中 的 其 他 成 员 。 
1.9 Python 快速 入门 


在 了 解 前 面 的 Python 基础 知识 之 后 ,让 我 们 通过 几 个 小 程序 来 快速 了 解 如 何 使 用 
Python 来 解决 实际 的 问题 。 就 像 前 面 介 绍 的 一 样 ,这 几 个 例子 的 代码 是 以 脚本 程序 的 方式 


基础 知识 


给 出 的 ,所 以 需要 在 IDLE 中 创建 一 个 程序 文件 ,然后 再 输入 这 里 的 代码 ,最 后 保存 为 扩展 
BA. py 的 文件 并 运行 。 

【 例 1-1】 用 户 输入 一 个 三 位 自然 数 ,计算 并 输出 其 百 位 、 十 位 和 个 位 上 的 数字 。 

这 个 例子 主要 演示 Python 中 算术 运算 符 的 用 法 ,而 计算 每 位 上 的 数字 有 多 种 方法 ,这 
里 只 给 出 其 中 一 种 ,您 能 再 想 出 几 种 呢 ? 哪 一 种 方法 的 计算 量 最 小 呢 ? 

x=input(" 请 输入 一 个 三 位 数 : ') 

a =x//100 

b -x//10$10 

c -x$10 

print (a, b, c) 


注 : 与 大 部 分 程序 设计 教材 一 样 ,本 书 中 给 出 的 代码 并 不 是 完整 的 代码 ,只 是 为 了 演示 
特定 的 功能 用 法 。 例 如 ,在 本 例 中 ,完整 的 程序 还 要 考虑 用 户 输入 是 否 为 数字 、 是 否 为 三 位 
数 等 ,可 以 使 用 if…else… 选 择 结构 在 计算 之 前 进行 判断 ,也 可 以 使 用 异常 处 理 结果 来 增加 
程序 的 健壮 性 和 容错 性 ,类 似 问题 后 面 不 再 袭 述 。 

【 例 1-2】 已 知 三 角形 的 两 边 长 及 其 夹 角 , 求 第 三 边 长 。 

这 里 需要 用 到 math 模块 中 求 平方 根 的 函数 sqrt CD ,当然 这 里 给 出 的 是 比较 传统 的 写 
法 ,参考 前 面 的 知识 ,相信 您 可 以 写 出 更 加 简洁 的 代码 。 

import math 

x - input ("ffi A PUK RK AA (HE): ') 

a, b, sita=x 

c-math.sqrt(a* *2+b* *2-2*a* b* math.cos(sita* math.pi/180)) 


print 'c=',c 


在 这 段 代码 中 使 用 到 了 序列 解 包 的 知识 ,在 后 面 会 详细 讲解 ,这 里 可 以 不 必 深 究 , 用 心 
体会 Python 的 精妙 和 强大 即 可 。 

[911-3]. 任意 输入 3 个 英文 单词 , 按 字 典 顺 序 输出 。 

在 本 例 中 ,主要 注意 变量 值 交换 的 方法 。 


s =input ('x,y,z=') 
X, y, 2=s.split(','") 
ifx»y: 

X, YY, X 
if x >z: 

X, 2=Z, X 
if y >z: 

Y, 2 =2, Y 
print (x, y, z) 


1.10 Python Z iif 


在 本 章 的 最 后 ,让 我 们 来 用 心 读 一 下 *Python 2 BR" ,笔者 认为 并 不 需要 翻译 这 一 段 话 ， 
也 不 必 进 行 过 多 的 解读 。 只 需要 用 心 去 体会 ,并 在 自己 编写 程序 的 时 候 多 想 想 这 段 话 ,努力 
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让 自己 编写 的 代码 更 加 优雅 ,更 加 Pythonic。 


Beautiful is better than ugly. 

Explicit is better than implicit. 

Simple is better than complex. 

Complex is better than complicated. 

Flat is better than nested. 

Sparse is better than dense. 

Readability counts. 

Special cases aren't special enough to break the rules. 

Although practicality beats purity. 

Errors should never pass silently. 

Unless explicitly silenced. 

In the face of ambiguity, refuse the temptation to guess. 

There should be one— and preferably only one— obvious way to do it. 
Although that way may not be obvious at first unless you're Dutch. 
Now is better than never. 

Although never is often better than right now. 

If the implementation is hard to explain, it's a bad idea. 

If the implementation is easy to explain, it may be a good idea. 


Namespaces are one honking great idea— let's do more of those! 


本 章 知 识 精 要 


(1) 选择 Python 版 本 时 应 首先 充分 了 解 自己 的 需求 和 可 用 的 扩展 库 情 况 。 

(2) 应 熟练 掌握 Python 扩展 库 管 理工 具 pip。 

(3) 在 Python 中 一 切 都 是 对 象 。 

(4) Python 采用 的 是 基于 值 的 内 存 管理 方式 。 

(5) 编程 时 优先 考虑 使 用 内 置 函数 来 实现 自己 的 业务 逻辑 。 

(6) del 命令 既 可 以 删除 一 个 变量 ,也 可 以 删除 列表 等 可 变 序列 的 部 分 元 素 。 

(7) 可 以 使 用 import 语句 来 导入 模块 中 的 对 象 。 

(8) Python 程序 使 用 缩 进来 体现 代码 之 间 的 逻辑 关系 ,并 且 建 议 使 用 必要 的 空格 、 空 
行 和 注释 来 提高 程序 的 可 读 性 。 


j 8 


1. 简单 说 明 如 何 选择 正确 的 Python 版 本 。 

2. 为 什么 说 Python 采用 的 是 基于 值 的 内 存 管理 模式 ? 

3. 在 Python 中 导入 模块 中 的 对 象 有 哪 几 种 方式 ? 

4. 使 用 pip 命令 安装 numpy 模块 和 scipy 模块 。 

5. 编写 程序 ,用 户 输入 一 个 三 位 以 上 的 整数 ,输出 其 百 位 以 上 的 数字 。 例 如 ,用 户 输 入 
1234, 则 程序 输出 12( 提 示 : 使 用 整除 运算 ) 。 
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序列 是 程序 设计 中 经 常用 到 的 数据 存储 方式 ,几乎 每 一 种 程序 设计 语言 都 提供 了 类 似 
的 数据 结构 ,如 C 和 Basic 中 的 一 维 、 多 维 数组 等 。 简 单 地 说 ,序列 是 一 块 用 来 存放 多 个 值 
的 连续 内 存 空间 ,同一 个 序列 中 的 元 素 通 常 是 相关 的 ,并 且 按 一 定 顺序 排列 。Python 提供 
的 序列 类 型 可 以 说 是 所 有 程序 设计 语言 的 类 似 数据 结构 中 最 灵活 的 ,也 是 功能 最 强大 的 。 

Python 中 常用 的 序列 结构 有 列表 、 元 组 .字典 .字符 串 、 集 合 以 及 range 对 象 等 。 除 了 
字典 和 集合 属于 无 序 序列 之 外 ,列表 、 元 组 ,字符 串 等 序列 均 支 持 双 向 索引 ,第 一 个 元 素 下 标 
为 0, 第 二 个 元 素 下 标 为 1, 以 此 类 推 ; 最 后 一 个 元 素 下 标 为 一 1, 倒 数 第 二 个 元 素 下 标 为 一 2， 
以 此 类 推 。 以 负数 作为 序列 索引 是 Python 语言 的 一 大 特色 ,熟练 掌握 和 运用 可 以 大 幅度 
提高 程序 开发 效率 。 

大 量 经 验 表明 ,熟练 掌握 Python 基本 数据 结构 (尤其 是 序列 ) 可 以 更 加 快速 有 效 地 解 
决 实际 问题 。 本 章 通 过 大 量 案例 介绍 列表 、 元 组 ,字典 集合 等 几 种 基本 数据 结构 的 用 法 , 同 
时 还 有 range 函数 的 巧妙 应 用 ,以 及 在 实际 应 用 中 非常 有 用 的 列表 推导 式 。 在 本 章 的 最 后 ， 
介绍 如 何 使 用 Python 序列 来 实现 栈 、 队 列 、 树 、 图 等 较为 复杂 的 数据 结构 。 


2.1 列 表 


列表 是 Python 的 内 置 可 变 序 列 ,是 包含 若干 元 素 的 有 序 连续 内 存 空 间 , 列 表 中 的 每 一 
个 数据 称 为 元 素 ,列表 的 所 有 元 素 放 在 一 对 中 括号 “([ 和 ])” 中 ,并 使 用 逗号 分 隔 开 。 当 列表 
增加 或 删除 元 素 时 ,列表 对 象 自动 进行 内 存 的 扩展 或 收缩 ,从 而 保证 元 素 之 间 没 有 缝 际 , 但 
这 涉及 列表 元 素 的 移动 ,效率 较 低 ,应 尽量 从 列表 尾部 进行 元 素 的 增加 与 删除 操作 以 提高 处 
理 速度 。 

注意 : 优先 考虑 从 列表 尾部 进行 元 素 的 增加 与 删除 操作 ,会 大 幅度 提高 列表 的 处 理 
ik. 

在 Python 中 ,同一 个 列表 中 元 素 的 数据 类 型 可 以 各 不 相同 ,可 以 同时 分 别 为 整数 、 实 
数 、 字 符 串 等 基本 类 型 ,甚至 是 列表 、 元 组 ,字典 、 集 合 以 及 其 他 自 定义 类 型 的 对 象 。 例 如 : 


[10, 20, 30, 40] 

['crunchy frog', ‘ram bladder', 'lark vomit'] 
['spam', 2.0, 5, [10, 20]] 

[['£ilel', 200,7], ['£ile2', 260,9]] 


都 是 合法 的 列表 对 象 。 

对 于 Python 序列 而 言 , 有 很 多 方法 是 通用 的 ,而 不 同类 型 的 序列 又 有 一 些 特有 的 方 
法 。 列 表 对 象 常用 的 方法 如 表 2-1 所 示 。 除 此 之 外 ,Python 的 很 多 内 置 函 数 和 命令 也 可 以 
对 列表 和 其 他 序列 对 象 进行 操作 ,后面 将 通过 一 些 案例 逐步 进行 介绍 。 
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表 2-1 列表 对 象 常用 的 方法 


方 法 说 明 
list. append x) 将 元 素 x 添加 至 列表 尾部 
list. extend(L) 将 列表 L 中 的 所 有 元 素 添 加 至 列表 尾部 
list. insert(index, x) 在 列表 指定 位 置 index 处 添加 元 素 x 
list. remove(x) 在 列表 中 删除 首次 出 现 的 指定 元 素 
list. pop(Lindex]) 删除 并 返回 列表 对 象 指定 位 置 的 元 素 , 默 认为 最 后 一 个 元 素 
list. clear. 删除 列表 中 所 有 元 素 , 但 保留 列表 对 象 ,该 方法 在 Python 2 中 没有 
list. index(x) 返回 值 为 x 的 首 个 元 素 的 下 标 , 若 元 素 不 存在 则 抛 出 异常 
list. countCx) 返回 指定 元 素 x 在 列表 中 的 出 现 次 数 
list. reverse 对 列表 元 素 进行 原 地 翻转 
list. sort 对 列表 元 素 进 行 原 地 排序 
list. copyO 返回 列表 对 象 的 浅 复制 ,该 方法 在 Python 2 中 没有 


2.1.1 列表 创建 与 删除 


如 同 其 他 类 型 的 Python 对 象 变量 一 样 ,使 用 = 直接 将 一 个 列表 赋值 给 变量 即 可 创建 
列表 对 象 , 例 如 : 


>>>a_list =['a', 'b', 'mpilgrim', 'z', 'example'] 


或 者 也 可 以 使 用 list() 函 数 将 元 组 range 对象、 字符 串 或 其 他 类 型 的 可 和 迭代 对 象 类 型 的 数 
据 转换 为 列表 。 例 如 : 


>>>a list -1ist((3,5,7,9,11)) 
>>>a list 

[3, 5, 7, 9, 11] 

>>> list (range (1,10,2)) 

[1, 3, 5, 7, 9] 

>>> list ("hello world') 


['h*, "et, "1", "1", 'o', ' ', tw, tot, tet, "1", 'd'] 


3X EU A BN PAA rangeO ,该 函数 语法 为 


range ([start,] stop[, step]) 

该 函数 接受 3 个 参数 : 第 一 个 参数 表示 起 始 值 (默认 为 0) ;第 二 个 参数 表示 终止 值 (结果 
中 不 包括 这 个 值 ); 第 三 个 参数 表示 步 长 (默认 为 1) ,函数 返回 一 个 range 对 象 (在 Python 2 中 
返回 一 个 包含 整数 的 列表 ) 。 

当 不 再 使 用 列表 时 ,使 用 del 命令 删除 整个 列表 ,如 果 列 表 对 象 所 指向 的 值 不 再 有 其 他 
对 象 指向 ,Python 将 同时 删除 该 值 。 


»»»dela list 


———————]132 
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>>>a list 
Traceback (most recent call last) : 
File "<pyshell#6>", line 1, in «module» 
a list 
NameError: name 'a list' is not defined 
正如 上 面 代码 所 展示 的 那样 ,删除 列表 对 象 a_list 之 后 ,该 对 象 就 不 存在 了 ,再 次 访问 
时 将 抛 出 异常 NameError, 提 示 访 问 的 对 象 名 不 存在 。 


2.1.2 列表 元 素 的 增加 与 删除 


在 实际 应 用 中 ,列表 元 素 的 动态 增加 和 删除 也 是 经 常 遇 到 的 操作 ,Python 列表 提供 了 
多 种 不 同 的 方法 来 实现 这 一 功能 ,本 节 对 此 做 了 比较 详细 的 讲解 和 对 比 。 

(1) 可 以 使 用 十 运算 符 来 实现 将 元 素 添加 到 列表 中 的 功能 。 虽 然 这 种 用 法 在 形式 上 比 
较 简单 并 且 容 易 理解 ,但 严格 意义 上 来 讲 , 这 并 不 是 真 的 为 列表 添加 元 素 ,而 是 创建 一 个 新 
列表 ,并 将 原 列表 中 的 元 素 和 新 元 素 依次 复制 到 新 列表 的 内 存 空间 。 由 于 涉及 大 量 元 素 的 
复制 ,该 操作 速度 较 慢 ,在 涉及 大 量 元 素 添加 时 不 建议 使 用 该 方法 。 


>>>aList = [3,4,5] 
>>>aList =aList + [7] 
>>>aList 

[3, 4, 5, 7] 


(2) 使 用 列表 对 象 的 append() 方 法 , 原 地 修改 列表 ,是 真正 意义 上 的 在 列表 尾部 添加 元 
素 ,速度 较 快 ,也 是 推荐 使 用 的 方法 。 


>>>aList.append (9) 
»»»aList 
(3, 4, 5, 7, 9] 


为 了 比较 十 和 append() 这 两 种 方法 的 速度 差异 ,请 看 以 下 代码 : 


import time 
result = [] 
start =time .time() 
for i in range (10000) : 
result =result + [i] 
print (len (result), ',', time.time()- start) 
result = [] 
start =time.time() 
for i in range (10000) : 
result .append (i) 
print (len(result), ',', time.time()- start) 


在 上 面 代码 中 ,分 别 重复 执行 10 000 次 十 运算 和 append() 方 法 为 列表 插入 元 素 , 使 用 
time 模块 的 timeO PR GR E M RR TB] ,然后 运行 代码 之 后 计算 时 间 差 。 其 中 一 次 的 运行 结 
果 如 下 ,可 以 看 出 ,这 两 个 方法 的 速度 相差 还 是 非常 大 的 ,使 用 append() 方 法 比 使 用 十 运算 
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快 约 70 倍 。 


10000, 0.21801209449768066 
10000, 0.003000020980834961 


前 面 曾经 提 到 过 ,Python 采用 的 是 基于 值 的 自动 内 存 管理 方式 , 当 为 对 象 修改 值 时 ,并 
不 是 真 的 直接 修改 变量 的 值 , 而 是 使 变量 指向 新 的 值 , 这 对 于 Python 所 有 类 型 的 变量 都 是 
一 样 的 ,例如 下 面 的 代码 : 


>>>a= [1,2,3] 
»»»id(a) 
20230752 

>>>a = [1,2] 
>>>id(a) 
20338208 


然而 ,对 于 列表 、 集 合 、 字 典 等 可 变 序列 类 型 而 言 ,情况 稍微 复杂 一 些 。 以 列表 为 例 , 列 
表 中 包含 的 是 元 素 值 的 内 存 地 址 ,而 不 是 直接 包含 元 素 值 。 如 果 是 直接 修改 序列 变量 的 值 ， 
则 与 Python 普通 变量 的 情况 是 一 样 的 ,而 如 果 是 通过 下 标 来 修改 序列 中 元 素 的 值 或 通过 
可 变 序列 对 象 自 身 提供 的 方法 来 增加 和 删除 元 素 时 ,序列 对 象 在 内 存 中 的 起 始 地 址 是 不 变 
的 。 例 如 下 面 的 代码 : 


>>>a= [1,2,4] 
>>>b= [1,2,3] 
>>>a==b 

False 

>>> id(a)==id(b) 
False 

>>> id(a[0])==id(b[0]) 
True 

>>>a = [1,2,3] 
»»»id(a) 
25289752 
»»»a.append(4) 
»»»id(a) 
25289752 
»»»a.remove (3) 
>>>a 

[1, 2, 4] 
»»»id(a) 
25289752 
»»a[0]-5 
>>>a 

[5, 2, 4] 
»»»id(a) 
25289752 
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»»»a.extend([7,8,9]) 
>>>a 

[5, 2, 4, 7, 8, 9] 
>>> id(a) 

25289752 


(3) 使 用 列表 对 象 的 extendO 〇 方法 可 以 将 另 一 个 迭代 对 象 的 所 有 元 素 添 加 至 该 列表 对 
象 尾部 。 正 如 上 面 的 代码 所 示 , 通 过 extend() 方 法 来 增加 列表 元 素 也 不 改变 其 内 存 首 地 
址 ,属于 原 地 操作 。 


»»»aList.extend([11,13]) 
>>>aList 

[3, 4, 5, 7, 9, 11, 13] 
»»»aList.extend((15,17)) 
>>>aList 

[3, 4, 5, 7, 9, 11, 13, 15, 17] 


(4) 使 用 列表 对 象 的 insert() 方 法 将 元 素 添 加 至 列表 的 指定 位 置 。 


»»»aList.insert (3,6) 
>>>aList 
[3, 4, 5, 6, 7, 9, 11, 13, 15, 17] 


正如 本 节 开 始 所 说 ,应 尽量 从 列表 尾部 进行 元 素 的 增加 与 删除 操作 。 列 表 的 insert O 
方法 可 以 在 列表 的 任意 位 置 插入 元 素 ,但 由 于 列表 的 自动 内 存 管理 功能 ,insert() 方 法 会 涉 
及 搬入 位 置 之 后 所 有 元 素 的 移动 ,这 会 影响 处 理 速度 ,类 似 的 还 有 后 面 介绍 的 remove O 77 
法 。 因 此 ,除非 有 必要 ,和 否则 应 尽量 避免 在 列表 中 间 位 置 插入 和 删除 元 素 的 操作 ,而 是 优先 
考虑 使 用 前 面 介绍 的 append() 方 法 。 下 面 的 代码 演示 了 insert() 方 法 和 append() 方 法 的 
效率 。 


import time 
def Insert (): 
a=[] 
for i in range (10000) : 


a.insert (0,i) 


def Append () : 
a-[l 
for i in range (10000): 
a.append (i) 
start =time.time() 
for i in range(10): 
Insert () 
print "Insert:',time.time()- start 
start =time.time() 
for i in range(10): 


Append () 
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print 'Append:',time.time()-start 


运行 结果 如 下 ,可 以 看 到 这 两 个 方法 的 速度 有 很 大 差异 ,后 面 的 列表 元 素 删除 方法 也 有 具 


有 同样 的 特点 LAS BEER 


Insert: 0.578000068665 
Append: 0.0309998989105 


C5) 使 用 乘法 来 扩展 列表 对 象 , 将 列表 与 整数 相 乘 ,生成 一 个 新 列表 ,新 列表 是 原 列 表 


中 元 素 的 重复 。 


>>>aList = [3,5,7] 
>>>bList =aList 
>>> id(aList) 
57091464 

>>> id (bList) 
57091464 

>>>aList =aList * 3 
»»»aList 

[3, 5, 7, 3, 5, 7, 3, 5, 7] 
»»»bList 

[3,5,7] 
»»»id(aList) 
57092680 

>>> id (bList) 
57091464 


通过 上 面 代码 的 运行 结果 可 以 看 出 ,该 操作 实际 上 是 创建 了 一 个 新 列表 ,而 不 是 扩展 原 


列表 。 该 操作 同样 适用 于 字符 串 和 元 组 。 


(6) 使 用 del 命令 删除 列表 中 指定 位 置 上 的 元 素 。 前 面 已 经 提 到 过 ,del 命令 也 可 以 直 


接 删 除 整个 列表 ,这 里 不 再 袭 述 。 


>>>del a_list[1] 
>>>a_list 
[3, 7, 9, 11] 


(7) 使 用 列表 的 pop() 方 法 删除 并 返回 指定 (默认 为 最 后 一 个 ) 位 置 上 的 元 素 ,如 果 给 


定 的 索引 超出 了 列表 的 范围 则 抛 出 异常 。 
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>>>a list =list ((3,5,7,9,11)) 
>>>a_list-pop() 

11 

>>>a list 

(3, 5, 7, 9] 

>>>a list.pop(1) 

5 

>>>a list 


[3, 7, 9] 
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(8) 使 用 列表 对 象 的 remove() 方 法 删除 首次 出 现 的 指定 元 素 , 如 果 列 表 中 不 存在 要 删 
除 的 元 素 , 则 抛 出 异常 。 


»»»a list = [3,5,7,9, 7,11] 
»»»a list.remove(7) 
»»»a list 


D, 5, 9, 7, M] 


有 时 可 能 需要 删除 列表 中 指定 元 素 的 所 有 重复 ,大 家 会 很 自然 地 想到 使 用 “循环 十 
remove()" 的 方法 ,但 是 具体 操作 时 很 有 可 能 会 出 现 意 料 之 外 的 错误 ,代码 运行 没有 出 现 错 
误 , 但 结果 是 错 的 。 例 如 ,下 面 的 代码 试图 删除 列表 中 所 有 的 1, 使 用 下 面 的 代码 从 前 向 后 
遍历 列表 元 素 , 遇 到 1 则 删除 ,然而 当 循环 结束 后 却 发 现 只 删除 了 一 半 , 还 有 一 半 并 没有 
删除 。 


>>>a list = [1,1,1,1,1,1,1,1,1,1,1,1] 
>>> len (a_ list) 
12 
>>>for i ina list: 

Es 

a list.remove(i) 

>>>a list 
(1, 1, 1, 1, 1, 1] 
>>> len (a_list) 
6 


出 现 这 个 问题 的 原因 是 列表 的 自动 内 存 管理 功能 ,前 面 已 经 提 到 ,在 删除 列表 元 素 时 ， 
Python 会 自动 对 列表 内 存 进 行 收缩 以 保证 所 有 元 素 之 间 没 有 空隙 ,这 样 的 话 ,每 当 删 除 一 
个 元 素 之 后 ,该 元 素 后 面 所 有 元 素 的 索引 就 都 改变 了 。 为 了 避免 这 样 的 问题 ,可 以 使 用 下 面 
代码 演示 的 方法 来 删除 列表 中 指定 元 素 的 所 有 重复 。 


>>>a_list = [1,1,1,1,1,1,1,1,1,1,1,1] 
>>>for i in a list[::-1]: 
ifi--1: 
a list.remove (i) 
>>>a list 
0 
>>> len (a_list) 
0 


2.1.3 列表 元 素 访问 与 计数 


如 同 其 他 语言 里 的 数组 一 样 , 可 以 使 用 下 标 直接 访问 列表 中 的 元 素 。 如 果 指 定 下 标 不 
存在 , 则 抛 出 异常 提示 下 标 越界 ,例如 : 


>>>aList =[3, 4, 5, 6, 7, 9, 11, 13, 15, 17] 
>>>aList[3] 
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6 
>>>aList[3] =5.5 
»»»aList 
I3, 4, 5, 5.5, 7, 9, 11, 13, 15, 17] 
»»»alist[15] 
Traceback (most recent call last): 

File "<pyshell# 34>", line 1, in «module» 

alist[15] 


IndexError: list index out of range 


使 用 列表 对 象 的 index() 方 法 可 以 获取 指定 元 素 首 次 出 现 的 下 标 ,语法 为 index(value， 
[start，[stop]]) ,其 中 start 和 stop 用 来 指定 搜索 范围 ,start 默认 为 0,stop 默认 为 列表 长 
度 。 若 列表 对 象 中 不 存在 指定 元 素 , 则 抛 出 异常 提示 列表 中 不 存在 该 值 ,例如 : 


>>>aList 
[3, 4, 5, 5.5, 7, 9, 11, 13, 15, 17] 
>>>aList.index (7) 
4 
>>>aList.index (100) 
Traceback (most recent call last): 
File "<pyshell# 36>", line 1, in <module> 
aList.index (100) 


ValueError: 100 is not in list 


如 果 需 要 知道 指定 元 素 在 列表 中 出 现 的 次 数 ,可 以 使 用 列表 对 象 的 count() 方 法 进行 
统计 ,例如 : 

>>>aList 

[3, 4, 5, 5.5, 7, 9, 11, 13, 15, 17] 

»»»aList.count (7) 

1 


>>> aList.count (0) 
0 


2.1.4 成 员 资格 判断 

如 果 需 要 判断 列表 中 是 否 存 在 指定 的 值 ,可 以 使 用 前 面 介绍 的 count() 方 法 ,如 果 存 在 
则 返回 大 于 0 的 数 , 如 果 返 回 0 则 表示 不 存在 。 或 者 ,使 用 更 加 简洁 的 in 关键 字 来 判断 一 
个 值 是 否 存在 于 列表 中 ,返回 结果 为 True 或 False。 


>>>aList 

[3, 4, 5, 5.5, 7, 9, 11, 13, 15, 17] 
>>>3 in aList 

True 

>>>18 in aList 

False 


>>>bList = [[1], [2], [31] 
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>>>3 in bList 

False 

>>>3 not in bList 

True 

>>> [3] in bList 

True 

»»»aList = [3, 5, 7, 9, 11] 

3»»bbist-['a', "bt. Ww *q'i 

>>> (3, 'a') in zip(aList, bList) 

True 

>>> for a,b in zip(aList,bList): 
print a,b 

3a 

5b 

7c 

9d 


关键 字 in 和 not in 也 可 以 用 于 其 他 可 迭代 对 象 ,包括 元 组 .字典 range 对 象 .字符 串 和 
集合 等 ,常用 在 循环 语句 中 对 序列 或 其 他 可 和 迭 代 对 象 中 的 元 素 进行 遍历 ,在 前 面 的 例子 中 已 
经 见 过 这 个 用 法 ,后 面 还 会 多 次 用 到 。 使 用 这 种 方法 来 侦 历 序列 或 迭代 对 象 ,可 以 减少 代码 
的 输入 量 ,简化 程序 员 的 工作 ,并 且 大 幅度 提高 程序 的 可 读 性 ,推荐 熟练 掌握 和 运用 。 


2.1.5 切片 操作 


切片 是 Python 序列 的 一 个 重要 操作 ,适用 于 列表 、 元 组 .字符 串 、range 对 象 等 类 型 。 
切片 使 用 2 个 冒号 分 隔 的 3 个 数字 来 完成 ,第 一 个 数字 表示 切片 的 开始 位 置 (默认 为 0) ,第 
二 个 数字 表示 切片 截止 (但 不 包含 ) 位 置 (默认 为 列表 长 度 ) ,第 三 个 数字 表示 切片 的 步 长 ( 默 
认为 D , 当 步 长 省 略 时 可 以 顺便 省 略 最 后 一 个 冒号 。 可 以 使 用 切片 来 截取 列表 中 的 任何 部 
分 ,得 到 一 个 新 列表 ,也 可 以 通过 切片 来 修改 和 删除 列表 中 的 部 分 元 素 ,甚至 可 以 通过 切片 
操作 为 列表 对 象 增加 元 素 。 

与 前 面 介绍 的 使 用 下 标 访问 元 素 的 方法 不 同 ,切片 操作 不 会 因为 下 标 越界 而 抛 出 异常 ， 
而 是 简单 地 返回 一 个 空 列表 或 在 列表 尾部 截断 。 


>>>aList = [3, 4, 5, 6, 7, 9, 11, 13, 15, 17] 
»»»alist[::] 

[3, 4, 5, 6, 7, 9, 11, 13, 15, 17] 
»»»aList[::-1] 

[17, 15, 13, 11, 9, 7, 6, 5, 4, 3] 
»»»aList[::2] 

[3, 5, 7, 11, 15] 

>>> aList [1::2] 

[4, 6, 9, 13, 17] 

»»»alist[3::] 

[6, 7, 9, 11, 13, 15, 17] 
»»»aList[3:6] 
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[6, 7, 9] 

»»»alist[3:6:1] 

[6, 7, 9] 

»»»alist[0:100:1] 

[3, 4, 5, 6, 7; 9, 11, 13, 15, 17] 
»»»a[100:] 

0] 


可 以 使 用 切片 操作 来 快速 实现 很 多 目的 ,如 原 地 修改 列表 内 容 , 列 表 元 素 的 增 、 删 、 改 、 
查 以 及 元 素 蔡 换 等 操作 都 可 以 通过 切片 来 实现 ,并 且 不 影响 列表 对 象 内 存 地 址 。 


>>>aList = [3,5,7] 
>>>aList[len(aList):] 
] 
>>>aList[len(aList):] = [9] 
»»»aList 

3, 5, 7, 9] 

»»»aList[:3] = [1,2,3] 

>>>aList 

1, 2, 3, 9] 

»»»aList[:3] =[] 

>>>aList 

9] 

»»»aList -list (range (10)) 

>>>aList 

0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 
»»»aList[::2] = [0] * (len(aList)//2) 
>>>aList 

0, 1, 0, 3, 0, 5, 0, 7, 0, 9] 


也 可 以 结合 使 用 del 命令 与 切片 操作 来 删除 列表 中 的 部 分 元 素 。 


>>>aList = [3,5,7,9,11] 
>>> del aList[:3] 
>>>aList 

[9, 11] 


需要 注意 的 是 ,切片 返回 的 是 列表 元 素 的 浅 复制 ,与 列表 对 象 的 赋值 并 不 一 样 。 例 如 下 
面 的 代码 : 


>>>aList = [3,5,7] 

>>>bList =aList #bList 与 aList 指 向 同一 个 内 存 
>>>bList 

[3, 5, 7] 

»»bList[1] -8 

>>>aList 

[3, 8, 7] 

>>>aList ==bList 
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True 


>>>aList is bList 


True 
»»»id(aList) 
19061816 
»»»alist- [3,5,7] 
>>> id (bList) 
19061816 


>>>bList =aList[::] 
>>>aList ==bList 
True 

>>>aList is bList 
False 

>>>id(aList) ==id(bList) 
False 

>>>bList [1] =8 
>>>bList 

(3, 8, 7] 

>>>aList 

(3, 5, 7] 

>>>aList ==bList 
False 

>>>aList is bList 
False 

>>> id(aList) 
19061816 

>>> id(bList) 
11656168 

>>> cmp (aList, bList) 
=a 


2.1.6 列表 排序 


# 浅 复制 


# 这 里 的 输出 结果 很 可 能 和 您 的 不 一 样 ,这 是 正常 的 


# 内 置 函 数 emp () 的 知识 请 参考 2.1.7 节 


在 实际 应 用 中 ,经 常 需要 对 列表 元 素 进行 排序 ,一 个 很 自然 的 想法 就 是 使 用 列表 对 象 自 
身 提供 的 sort() 方 法 进行 原 地 排序 ,该 方法 支持 多 种 不 同 的 排序 方式 。 


»»»aList = [3, 4, 5, 6, 7, 9, 11, 13, 15, 17] 


>>> import random 
>>> random. shuffle (aList) 
>>>aList 

[3, 4 15, 11, 9,17, 13,.6, 7,5) 
»»»alist.sort() 

»»»aList 

I 57:6; 7,9, 113, 13; 15,33] 
»»»aList.sort (reverse =True) 


>>> alist 


# 打 乱 顺 序 


# 默 认为 升序 排列 


# 也 可 以 降序 排列 


ss 
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[17, 15, 13, 11, 9, 7, 6, 5, 4, 3] 
»»»aList.sort (key = lambda x:len (str (x))) $A CHEF 
>>> aList 


I9, 7; 6, 5, 4, 3, 17, 15, 13, 11] 


也 可 以 使 用 内 置 函 数 sorted() 对 列表 进行 排序 ,与 列表 对 象 的 sort() 方 法 不 同 , 该 函数 


返回 新 列表 ,并 不 对 原 列表 进行 任何 修改 。 


>>>aList 

[9, 7, 6, 5, 4, 3, 17, 15, 13, 11] 
»»» sorted (aList) 

[3, 4, 5, 6, 7, 9, 11, 13, 15, 17] 
>>> sorted (aList, reverse - True) 
[17, 15, 13, 11, 9, 7, 6, 5, 4, 3] 


在 某 些 应 用 中 可 能 需要 将 列表 元 素 进 行 逆序 排列 ,也 就 是 所 有 元 素 位 置 反 转 ,第 一 个 变 


成 最 后 一 个 ,第 二 个 变 成 倒数 第 二 个 ,以 此 类 推 。 可 以 使 用 列表 对 象 的 reverse ) 方 法 将 元 
素 原 地 逆序 : 


>>> import random 

»»»aList = [random.randint (50,100) for i in range (10)] 
>>>aList 

[87, 79, 52, 96, 56, 59, 74, 80, 53, 79] 

>>> aList.reverse () 

>>>aList 

[79, 53, 80, 74, 59, 56, 96, 52, 79, 87] 


Python 提供 了 内 置 函数 reversed O 5¢ He Xt 9 de JG HK iE IT WF HE BA), 55 3 Ze AT BW 


reverse() 方 法 不 同 , 该 函数 不 对 原 列表 做 任何 修改 ,而 是 返回 一 个 逆序 排列 后 的 迭代 对 象 。 
例如 : 


>>>aList = [3, 4, 5, 6, 7, 9, 11, 13, 15, 17] 
»»»newList = reversed (aList) 

>>>newList 

<listreverseiterator object at 0x0000000003624198> 
>>> list (newList) 

[17, 15; 13, 31, 9-7) 6; 5, 4; 3] 

>>> for i in newList: 


print i, 


在 上 面 代码 中 ,最 后 的 for 循环 没有 输出 任何 内 容 , 因 为 在 之 前 的 list() 函数 执行 时 ,和 迭 


代 对 象 已 遍历 结束 ,需要 重新 创建 迭代 对 象 才能 再 次 访问 其 内 容 , 即 : 


一 人 2 


>>>newList = reversed (aList) 
>>> for i in newList: 
print i, 


17151311976543 
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2.1.7 用 于 序列 操作 的 常用 内 置 函数 


由 于 序列 的 重要 性 和 广泛 应 用 ,Python 提供 了 大 量 可 用 于 序列 操作 的 内 置 函数 ,在 
1.4.6 节 已 经 介绍 了 几 个 ,本 节 再 通过 示例 来 简单 扩展 一 下 。 

(1) cmp( 列 表 1, 列 表 20 : 对 两 个 列表 进行 比较 , 若 第 一 个 列表 大 于 第 二 个 , 则 结果 为 
1, 和 否则 为 一 1 ,元素 完全 相同 则 结果 为 0, 类 似 于 三 三 运算 符 , 但 和 is is not 不 一 样 。 例 如 : 


>>> (L 2 < 2 

True 

>>>cmp((1, 2, 3) , (1, 2, 4)) 
=L 

>>> [1, 2, 3] < [1, 2, 4] 

True 


>>> 'ABC' < 'C' < 'Pascal' < 'Python' 


True 

>>> (1, 2, 3, 4) < (1, 2, 4) 
True 

>>> (1, 2) < (1, 2, -1) 
True 


>>>cmp((1, 2), (1, 2, -1)) 


<t 

>>> (1, 2, 3) == (1.0, 2.0, 3.0) 

True 

>>>cmp((1, 2, 3), (1.0, 2.0, 3.0)) 

0 

>>> (1, 2, ('aa', 'ab')) < (1, 2, ("abc', 'a'), 4) 
True 


»»»cmp('a','A') 

1 

在 Python 3. x 中 不 支持 cmp() 函 数 ,可 以 使 用 关系 运算 符 比较 序列 大 小 。 

(2) len( 列 表 ): 返回 列表 中 的 元 素 个 数 , 同 样 适用 于 元 组 .字典 、 集 合 、 字 符 串 和 range 
对 象 等 各 种 可 迭代 对 象 。 

(3) max( 列 表 )、min( 列 表 ): 返回 列表 中 的 最 大 或 最 小 元 素 , 同 样 适用 于 元 组 ,字符 
串 、 集 合 range 对 象 和 字典 等 。 但 对 字典 进行 操作 时 ,默认 是 对 字典 的 “ 键 ” 进 行 计算 ,如 果 
需要 对 字典 的 “ 值 ” 进 行 计算 , 则 需要 使 用 字典 对 象 的 values() 方 法 明确 说 明 。 

>>>a= {1:1,2:5,3:8} 

>>>max (a) 

3 


>>>max (a.values ()) 


8 


(4) sum( 列 表 ): 对 数值 型 列表 的 元 素 进行 求 和 运算 ,对 非 数值 型 列表 运算 则 出 错 , 同 
样 适用 于 元 组 、 集 合 .range 对 象 . 字 典 等 。 但 对 字典 进行 操作 时 ,默认 是 对 字典 * 键 "进行 计 
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算 , 如 果 需 要 对 字典 * 值 ?进行 计算 , 则 需要 使 用 字典 对 象 的 values ) 方 法 明确 说 明 。 


>>> a= {1:1,2:5,3:8} 
>>> sum (a) 

6 

>>> sum (a.values ()) 


14 


(5) zip( 列 表 1, 列 表 2,…): 将 多 个 列表 或 元 组 对 应 位 置 的 元 素 组 合 为 元 组 ,并 返回 包 


含 这 些 元 组 的 列表 (Python 2. x) ak zip 对 象 (Python 3. x) 。 例 如 ,在 Python 2. 7. 8 中 代码 
运行 如 下 : 


>>>aList = [1,2,3] 

>>>bList = [4,5,6] 

»»»cList = [7,8,9] 

>>>dList =zip(aList, bList, cList) 
>>>dList 

[(1, 4, 7), (2, 5, 8), (3, 6, 9] 


而 在 Python 3. 4. 2 中 则 需要 这 样 使 用 : 


>>>aList = [1,2,3] 

>>>bList = [4,5,6] 

>>> cList=zip (a,b) 

>>>cList 

<zip object at 0x0000000003728908> 
>>> list (cList) 

ta, 4), (2, 5), (3, 69] 


(6) enumerate( 列 表 ): BOE 31 6 6 2H 2X Hc fib n ARR S MITER «a EAE R S CIE 


对 象 中 每 个 元 素 是 包含 下 标 和 元 素 值 的 元 组 。 该 函数 对 字符 串 、 字 典 同样 有 效 。 但 对 字典 
进行 操作 时 ,默认 是 对 字典 “ 键 " 进 行 计算 ,如 果 需 要 对 字典 “ 值 ” 进 行 计算 , 则 需要 使 用 字典 
对 象 的 values() 方 法 明确 说 明 。 
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»»»for item in enumerate (cList): 
print item 
(0, (1, 4)) 
(1, (2, 5) 
(2, (3, 6)) 
>>> for index, ch in enumerate ('SDIBT'): 
print ( (index, ch) ,end=', ') 
(0, 'S'), (1, 'D'), (2, '1'), (3, "B'), (4, 'T'), 
>>>a 
{1: 1, 2: 5, 3: 8} 
>>> for i,v in enumerate (a) : 
print i,v 


01 
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12 

23 

>>> for i,v in enumerate (a.values ()): 
print i,v 

01 

15 

28 


2.1.8 列表 推导 式 

列表 推导 式 可 以 说 是 Python 程序 开发 时 应 用 最 多 的 技术 之 一 。 前 面 曾经 使 用 列表 推 
导 式 来 快速 生成 包含 多 个 随机 数 的 列表 ,可 以 看 出 ,列表 推导 式 使 用 非常 简洁 的 方式 来 快速 
生成 满足 特定 需求 的 列表 ,代码 具有 非常 强 的 可 读 性 。 例 如 : 

>>>aList = [x* x for x in range (10)] 
HT. 

>>>aList - [] 


>>> for x in range (10) : 


aList.append|(x* x) 


而 
»»»freshfruit = [' banana', ' loganberry ', 'passion fruit '] 
»»»aList = [w.strip() for w in freshfruit] 

则 等 价 于 下 面 的 代码 : 
>>> freshfruit = [' banana', ' loganberry ', 'passion fruit '] 
»»»for i,v in enumerate (freshfruit): 

freshfruit[i] =v.strip() 

同时 ,也 等 价 于 
>>> freshfruit = [' banana', ' loganberry ', 'passion fruit '] 
>>> freshfruit = list (map (str.strip, freshfruit) ) 

但 是 不 等 价 于 下 面 的 代码 : 


>>> freshfruit =[' banana', ' loganberry ', ‘passion fruit '] 
>>> for i in freshfruit: 


i-i.strip() 


下 面 通过 几 个 示例 来 进一步 体会 列表 推导 式 的 强大 功能 。 
(1) 使 用 列表 推导 式 实现 嵌 套 列表 的 平 铺 。 
>>>vec = (,2,3], [4,5,6], [7,8,9]] 


>>> [num for elem in vec for num in elem] 


[1, 2, 3, 4, 5, 6, 7, 8, 9] 
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(2) 过 滤 不 符合 条 件 的 元 素 。 
在 列表 推导 式 中 可 以 使 用 庄子 句 来 进行 筛选 .例如 ,下 面 的 代码 可 以 列 出 当前 文件 夹 
所 有 Python 源 文件 : 


»»»import os 
>>> [filename for filename in os.listdir('.') if filename.endswith('.py')] 


下 面 的 代码 用 于 从 列表 中 选择 符合 条 件 的 元 素 组 成 新 的 列表 : 


>>>aList = [- 1,- 4,6,7.5,-2.3,9,- 11] 
>>> [i for i in alist if i>0] 


[6, 7.5, 9] 


再 如 ,已 知 有 一 个 包含 一 些 同学 成 绩 的 字典 ,计算 成 绩 的 最 高 分 .最 低 分 和 平均 分 ,并 查 


找 所 有 最 高 分 的 同学 ,代码 可 以 这 样 编写 : 


句 过 


也 可 
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>>> scores = ("Zhang San": 45, "Li Si": 78, "Wang Wu": 40, "Zhou Liu": 96, "Zhao Qi": 65, "Sun 
Ba": 90, "Zheng Jiu": 78, "Wu Shi": 99, "Dong Shiyi": 60} 

»»»highest =max (scores.values()) 

>>> lowest =min(scores.values ()) 

>>> highest 

99 

>>> Lowest 

40 

>>> average = sum(scores.values()) * 1.0/len (scores) 

>>> average 

72 .33333333333333 

>>> highestPerson = [name for name, score in scores.items() if score ==highest] 
»»»highestPerson 

['Wu Shi'] 

(3) 在 列表 推导 式 中 使 用 多 个 循环 ,实现 多 序列 元 素 的 任意 组 合 , 并 且 可 以 结合 条 件 语 
滤 特定 元 素 : 

>>> [ (x,y) for x in range(3) for y in range(3)] 

[(0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2), (2, 0), (2, 1), (2, 2)] 


>>> [(x, y) for x in [1,2,3] for y in [3,1,4] if x !=y] 
[(1, 3), (1, 4), (2, 3), (2, 1), (2, 4), (3, 1), (3, 4] 


(4) 使 用 列表 推导 式 实现 矩阵 转 置 : 


>>>matrix = [ [1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]] 
>>> [[row[i] for row in matrix] for i in (4)] 


[[1, 5, 9], I2, 6, 10], [3, 7, 11], [4, 8, 12]] 
以 使 用 内 置 函 数 zsip() 和 list() 来 实现 矩阵 转 置 : 


>>> list(zip(x matrix)) 
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[(1, 5, 9), (2, 6, 10), (3, 7, 11), (4, 8, 12)] 


22 3 组 


与 列表 类 似 , 元 组 也 是 Python 的 一 个 重要 序列 结构 ,但 与 列表 不 同 的 是 ,元 组 属于 不 
可 变 序 列 。 元 组 一 旦 创建 ,用 任何 方法 都 不 可 以 修改 其 元 素 的 值 ,也 无 法 为 元 组 增加 或 删除 
元 素 ,如 果 确 实 需 要 修改 的 话 , 只 能 再 创建 一 个 新 的 元 组 。 

元 组 的 定义 形式 和 列表 相似 ,区 别 在 于 定义 元 组 时 所 有 元 素 放 在 一 对 圆 括号 中 , 即 () 
中 ,而 不 是 方 括号 中 。 


2.2.1 元 组 的 创建 与 删除 
使 用 = 将 一 个 元 组 赋值 给 变量 ,就 可 以 创建 一 个 元 组 变量 。 


>>>a_tuple = ('a', ) 

>>>a_tuple 

(‘a’) 

>>>a_tuple = ('a', 'b', 'mpilgrim', 'z', 'example') 
>>>a_tuple 

('a', 'b', 'mpilgrim', 'z', 'example') 


如 果 要 创建 只 包含 一 个 元 素 的 元 组 ,只 把 元 素 放 在 圆 括号 里 是 不 行 的 ,还 需要 在 元 素 后 
面 加 一 个 逗号 ”“,”, 而 创建 包含 多 个 元 素 的 元 组 则 不 存在 这 个 问题 。 


>>>a=3 
>>>a 

3 

>>>a= (3) 
>>>a 

3 
>>>a=3, 
>>>a 

(3,) 
>>>a=1,2 
>>>a 


(1, 2) 


如 同 使 用 listO 函数 将 序列 转换 为 列表 一 样 ,也 可 以 使 用 tuple 〇 函数 将 其 他 类 型 序列 
转换 为 元 组 。 


>>>print tuple ('abcdefg') 

par tb, tet, 'd', 'e*, *£*, 'q') 
»»»aList 

[-1, -4, 6, 7.5, -2.3, 9, - 11] 
>>>tuple (aList) 

(71, -4, 6, 7.5, -2.3, 9, - 11) 
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对 于 元 组 而 言 ,只 能 使 用 del 命令 删除 整个 元 组 对 象 ,而 不 能 只 删除 元 组 中 的 部 分 元 
素 , 因 为 元 组 属于 不 可 变 序列 。 


2.2.2 元 组 与 列表 的 区 别 


列表 属于 可 变 序 列 , 可 以 随意 地 修改 列表 中 的 元 素 值 以 及 增加 和 删除 列表 元 素 ,而 元 组 
属于 不 可 变 序列 ,元 组 中 的 数据 一 旦 定义 就 不 允许 通过 任何 方式 进行 更 改 。 因 此 ,元 组 没有 
提供 append() „extend O 和 insert() 等 方法 ,无 法 向 元 组 中 添加 元 素 ;同样 ,元 组 也 没有 
remove() 和 pop() 方 法 ,也 不 支持 对 元 组 元 素 进 行 del 操作 ,不 能 从 元 组 中 删除 元 素 ,只 能 
使 用 del 命令 删除 整个 元 组 。 元 组 也 支持 切片 操作 ,但 是 只 能 通过 切片 来 访问 元 组 中 的 元 
素 ,而 不 支持 使 用 切片 来 修改 元 组 中 元 素 的 值 , 也 不 支持 使 用 切片 操作 来 为 元 组 增加 或 删除 
元 素 。 

Python PY $t pA MC tuple() 可 以 接受 一 个 列表 、 字 符 串 或 其 他 序列 类 型 和 和 迭代 器 作为 参 
数 ,并 返回 一 个 包含 同样 元 素 的 元 组 ,而 list O 函数 可 以 接受 一 个 元 组 ,字符 串 或 其 他 序列 
类 型 和 和 迭 代 器 作为 参数 并 返回 一 个 列表 。 从 效果 上 看 ,tuple() 函 数 可 以 看 作 是 在 冻结 列表 
并 使 其 不 可 变 ,而 list() 是 在 融化 元 组 使 其 可 变 。 

元 组 的 访问 和 处 理 速度 比 列表 更 快 。 如 果 定 义 了 一 系列 常量 值 ,主要 用 途 仅 是 对 它们 
进行 遍历 或 其 他 类 似 用 途 ,而 不 需要 对 其 元 素 进 行 任何 修改 ,那么 一 般 建议 使 用 元 组 而 不 用 
列表 。 可 以 认为 元 组 对 不 需要 修改 的 数据 进行 了 “ 写 保护 ”从 内 在 实现 上 不 允许 修改 其 元 
素 值 ,从 而 使 得 代码 更 加 安全 。 

最 后 ,作为 不 可 变 序 列 ,与 整数 .字符 串 一 样 ,元 组 可 用 作 字 典 的 键 ,而 列表 则 永远 都 不 
能 当 作 字典 键 使 用 ,因为 列表 是 可 变 的 。 


2.2.3 序列 解 包 


在 实际 开发 中 ,序列 解 包 是 非常 重要 和 常用 的 一 个 用 法 ,可 以 以 非常 简洁 的 形式 完成 复 
杂 的 功能 ,大 幅度 提高 了 代码 的 可 读 性 ,并 且 减 少 了 程序 员 的 代码 输入 量 。 例 如 ,可 以 使 用 
序列 解 包 功能 对 多 个 变量 同时 进行 赋值 : 

>>>x,y,z =1,2,3 

>>>x,y,2 

(1, 2, 3) 

>>>print x,y,z 

A23 


再 如 : 


v tuple = (False, 3.5, 'exp') 
>>> (x, y, z) -v tuple 


或 者 
>>>x, y, z =v tuple 


序列 解 包 也 可 以 用 于 列表 和 字典 ,但 是 对 字典 使 用 时 ,默认 是 对 字典 * 键 ?进行 操作 ,如 
果 需 要 对 键 - 值 对 进行 操作 ,需要 使 用 字典 的 items() 方 法 ;如 果 需 要 对 字典 “ 值 ” 进 行 操作 ， 


48 


Python 数据 结构 


则 需要 使 用 字典 的 values() 方 法 明确 指定 。 对 字典 操作 时 ,不 需要 对 元 素 的 顺序 考虑 过 多 。 
例如 ,下 面 的 代码 演示 了 列表 与 字典 的 序列 解 包 操作 : 


>>>a= [1,2,3] 
>>>b,c,d=a 

»»»s- ('a' :1, "b':2, 'c':3) 
»»»b,c,d-s.items() 

>>>b 

(*e*; 3) 

>>>b,c,d=s 


>>>b,c,d =s.values () 
>>> print b,c,d 
£32 


使 用 序列 解 包 可 以 很 方便 地 同时 遍历 多 个 序列 。 
>>> keys= ['a', 'b','c','d'] 
>>>values= [1,2,3,4] 


>>> for k,v in zip (keys,values): 


print k,v 


在 前 面 章节 中 关于 内 置 函 数 enumerate() 的 示例 中 ,也 是 采用 了 序列 解 包 的 操作 。 再 
如 ,下 面 对 字 典 的 操作 也 使 用 到 序列 解 包 : 

>>> s={'a':1, 'b':2,'c':3) 

>>> for k,v in s.items(): 


print k,v 


在 调用 函数 时 ,在 实 参 前 面 加 上 一 个 星 号 (* ) 也 可 以 进行 序列 解 包 , 从 而 实现 将 序列 中 
的 元 素 值 依次 传递 给 相同 数量 的 形 参 , 详 见 5.3.4 节 。 
2.2.4 生成 器 推导 式 

从 形式 上 看 ,生成 器 推导 式 与 列表 推导 式 非 常 接近 ,只 是 生成 器 推导 式 使 用 圆 括号 而 不 
是 列表 推导 式 所 使 用 的 方 括号 。 与 列表 推导 式 不 同 的 是 ,生成 器 推导 式 的 结果 是 一 个 生成 


器 对 象 ,而 不 是 列表 ,也 不 是 元 组 。 使 用 生成 器 对 象 的 元 素 时 ,需要 将 其 转化 为 列表 或 元 组 ， 
也 可 以 使 用 生成 器 对 象 的 next() 方 法 (Python 2. x) 或 _next _ 0) 方法 (Python 3. x) 进 行 遍 
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历 , 或 者 直接 将 其 作为 迭代 器 来 使 用 。 但 是 不 管用 哪 种 方法 访问 其 元 素 , 当 所 有 元 素 访问 结 
东 以 后 ,如 果 需 要 重新 访问 ,必须 重新 创建 该 生成 器 对 象 。 


»»»g- ((i+2) * * 2 for i in range (10)) 


»g 
«generator object <genexpr>at Ox02B15C60» 

>>> tuple (g) # 转 化 为 元 组 
(4，9，16，25，36，49，64，81，100，121) 

>>> tuple (g) # 元 素 已 经 遍历 结束 


0 

»»»g- ((i+2) * * 2 for i in range (10)) # 重 新 创建 生成 器 对 象 

>>> List (g) # 转 化 为 列表 

[4, 9, 16, 25, 36, 49, 64, 81, 100, 121] 

>>>g= ((i*2)* * 2 for i in range(10)) 

»»»g.next() # 单 步 和 迭代 ,在 Python 3 中 应 改 为 _next _() 

4 

»»»g.next() 

3 

>>>g-next () 

16 

>>>g-next () 

25 

>>>g= ((i*2)* * 2 for i in range (10) ) 

>>>for iing: # 直 接 进行 循环 迭代 
print i, 

4 9 16 25 36 49 64 81 100 121 


2.3 字 MW 


字典 是 键 - 值 对 的 无 序 可 变 序列 ,字典 中 的 每 个 元 素 包 含 两 部 分 : 键 和 值 。 定 义 字典 
时 ,每 个 元 素 的 键 和 值 用 骨 号 分 隔 , 相 邻 元 素 之 间 用 逗号 分 隔 ,所 有 的 元 素 放 在 一 对 大 括号 
中 , 即 {} 中 。 

字典 中 的 键 可 以 为 任意 不 可 变数 据 , 比 如 整数 实数、 复数 .字符 串 和 元 组 等 ,但 不 能 使 
用 列表 、 集 合 . 字 典 作为 字典 的 键 ,因为 这 些 类 型 的 对 象 是 可 变 的 。 另 外 ,字典 中 的 键 不 允许 
重复 , 值 是 可 以 重复 的 。 

可 以 使 用 内 置 函 数 globals() 返 回 和 查看 包含 当前 作用 域内 所 有 全 局 变量 和 值 的 字典 ， 
1i HI VA EE eC locals() 返 回 包含 当前 作用 域内 所 有 局 部 变量 和 值 的 字典 。 


»»a- (1, 2, 3, 4, 5) 
>>>b = 'Hello world.' 
»»»def demo () : 

a=3 

b= [1,2,3] 

print 'locals:', locals () 
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print 'globals:',globals() 
»»»demo() 

locals: ('a': 3, 'b': [1, 2, 3]) 

globals: ('a': (1, 2, 3, 4, 5), 'b': 'Hello world.', ' builtins ': «module 

' builtin ' (built-in)», 'demo': «function demo at 0x013907F0>, ' package ': 


None, ' name ':' main ',' doc ': None} 


2.3.1 字典 创建 与 删除 
与 列表 和 元 组 的 创建 一 样 ,使 用 二 将 一 个 字典 赋值 给 一 个 变量 即 可 创建 一 个 字典 变量 。 
>>>a_dict = ('server': 'db.diveintopython3.org', 'database': 'mysql') 


»»»a dict 
('database': 'mysql', 'server': 'db.diveintopython3.org'] 
可 以 使 用 内 置 函数 dict() 通 过 已 有 数据 快速 创建 字典 : 
>>> keys= ['a', 'b', 'c', 'd'] 
»»»values- [1,2,3,4] 
»»»dictionary-dict (zip (keys, values)) 
»»»print dictionary 
Tat 1, *c't 3, bti 2; d'r ap 
或 者 使 用 内 置 函 数 dict() 根 据 给 定 的 键 - 值 对 来 创建 字典 : 
>>> d- dict (name= 'Dong' , age- 37) 
>>>d 
{'age': 37, 'name': 'Dong'} 
还 可 以 以 给 定 内 容 为 键 ,创建 值 为 空 的 字典 : 
»»»adict-dict.fromkeys (['name', 'age', 'sex']) 
>>>adict 
{'age': None, 'name': None, 'sex': None} 
不 再 需要 某 个 字典 时 ,可 以 使 用 del 命令 删除 整个 字典 ,也 可 以 使 用 del 命令 删除 字典 
中 指定 的 元 素 ,请 参考 后 面 的 内 容 。 


2.3.2 字典 元 素 的 读 取 


与 列表 和 元 组 类 似 , 可 以 使 用 下 标的 方式 来 访问 字典 中 的 元 素 , 但 不 同 的 是 字典 的 下 标 
是 字典 的 “ 键 ”, 而 列表 和 元 组 访问 时 下 标 必须 为 整数 值 。 使 用 下 标的 方式 访问 字典 值 时 , 若 
指定 的 “ 键 ” 不 存在 则 抛 出 异常 。 


»»»aDict- ('name':'Dong', 'sex':'male', 'age':37} 
»»»aDict['name'] 

"Dong" 

»»»aDict['tel'] 

Traceback (most recent call last): 
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File "<pyshell# 53>", line 1, in «module» 
aDict ["tel"] 
KeyError: 'tel' 


目前 推荐 使 用 的 且 更 加 安全 的 字典 元 素 访问 方式 是 字典 对 象 的 get() 方 法 。 使 


月 字典 


对 象 的 get() 方 法 可 以 获取 指定 键 对 应 的 值 , 并 且 可 以 在 指定 * 键 ?不 存在 的 时 候 返 回 指定 


值 ,如 果 不 指定 则 默认 返回 None。 


»»» print (aDict.get ("address')) 
None 

»»»print(aDict.get('address', 'SDIBT')) 
SDIBT 

»»»aDict['score'] =aDict.get ('score', []) 
»»»aDict['score'].append (98) 
»»»aDict['score'].append (97) 

»»»abict 


('age': 37, 'score': [98, 97], 'name': 'Dong', 'sex': 'male'] 


另外 ,使 用 字典 对 象 的 items() 方 法 可 以 返回 字典 的 键 - 值 对 列表 ,使 用 字典 对 象 的 keys() 
方法 可 以 返回 字典 的 “ 键 "列表 ,使 用 字典 对 象 的 values() 方 法 可 以 返回 字典 的 “ 值 ? 列 表 。 


»»»aDict- ('name':'Dong', 'sex':'male', 'age':37) 
»»»for item in aDict.items(): 
print item 
('age', 37) 
('name', 'Dong') 
('sex', 'male') 
>>> for key in aDict: 
print key 
age 
name 
sex 
>>> for key, value in aDict.items(): 
print key, value 
age 37 
name Dong 
sex male 
>>>print aDict.keys() 
['age', 'name', 'sex'] 
»»»aDict.values() 


[37, 'Dong', 'male'] 


2.3.3 字典 元 素 的 操作 


当 以 指定 “ 键 ” 为 下 标 为 字典 元 素 赋值 时 .车 该 “ 键 " 存 在 , 则 表示 修改 该 “ 键 " 的 值 ;车 


键 不 存在 , 则 表示 添加 一 个 新 的 键 - 值 对 ,也 就 是 添加 一 个 新 元 素 。 
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»»»aDict['age'] =38 
>>>aDict 

('age': 38, 'name': 'Dong', 'sex': 'male'} 
»»»aDict['address'] = 'SDIBT' 

»»»aDict 


{'age': 38, 'address': 'SDIBT', 'name': 'Dong', 'sex': 'male'] 


使 用 字典 对 象 的 update ) 方 法 将 另 一 个 字典 的 键 - 值 对 一 次 性 全 部 添加 到 当前 字典 
对 象 。 


>>>aDict 

('age': 37, 'score': [98, 97], 'name': 'Dong', 'sex': 'male'} 

»»»aDict.items() 

[('age', 37), ('score', [98, 97]), ('name', 'Dong'), ('sex', 'male')] 

>>> aDict.update({'a':'a', 'b':'b']) 

>>> aDict 

{'a': 'a', 'score': [98, 97], 'name': 'Dong', 'age': 37, 'b': 'b', 'sex': 'male'} 

需要 删除 字典 元 素 时 ,可 以 根据 具体 要 求 使 用 del 命令 删除 字典 中 指定 “ 键 ” 对 应 的 元 
素 , 或 者 也 可 以 使 用 字典 对 象 的 clear( ) 方 法 来 删除 字典 中 的 所 有 元 素 , 还 可 以 使 用 字典 对 
象 的 pop 〇 方法 删除 并 返回 指定 键 的 元 素 ,或 者 使 用 字典 对 象 的 popitem() 方 法 删除 并 返回 
字典 中 的 一 个 元 素 ,大 家 可 以 自行 练习 这 些 用 法 。 


2.4 集 合 


集合 是 无 序 可 变 集 合 , 与 字典 一 样 使 用 一 对 大 括号 作为 界定 符 , 同 一 个 集合 的 元 素 之 间 
不 允许 重复 ,集合 中 每 个 元 素 都 是 唯一 的 。 


2.4.1 集合 的 创建 与 删除 


正如 前 面 多 次 提 到 的 那样 ,在 Python 中 变量 不 需要 提前 声明 其 类 型 ,直接 将 集合 赋值 
给 变量 即 可 创建 一 个 集合 对 象 。 


>>>a = {3,5} 
>>>a.add(7) 
>>>a 


set ([3, 5, 7]) 


也 可 以 使 用 set() 函 数 将 列表 ,元 组 等 其 他 可 迭代 对 象 转换 为 集合 ,如 果 原 来 的 数据 中 
存在 重复 元 素 , 则 在 转换 为 集合 时 只 保留 一 个 。 


>>>a_set= set (range (8,14) ) 

>>>a_set 

set ((8, 9, 10, 11, 12, 13]) 

»»»b set-set([0,1,2,3,0,1,2,3,7,8]) 
»»»b set 
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set ([0, 1, 2, 3, 7, 8]) 


不 再 使 用 某 个 集合 时 ,可 以 使 用 del 命令 删除 整个 集合 。 另 外 ,也 可 以 使 用 集合 对 象 的 


pop() 方 法 弹出 并 删除 其 中 一 个 元 素 , 或 者 使 用 集合 对 象 的 remove ) 方 法 直接 删除 指定 元 
素 , 以 及 使 用 集合 对 象 的 clear() 方 法 清空 集合 并 删除 所 有 元 素 。 


>>>a= {1,4,2,3} 
>>>a.pop() 
1 
>>>a 
set ([2, 3, 4]) 
>>> a.pop() 
2 
>>>a 
set ([3, 4]) 
>>>a.add (2) 
>>>a 
set([2, 3, 4]) 
»»»a.remove (3) # 删除 指定 元 素 
>>>a 
set ([2, 4]) 
>>> a.pop (2) # pop () 方 法 不 接受 参数 
Traceback (most recent call last): 

File "<pyshell# 76>", line 1, in «module» 

a.pop(2) 

TypeError: pop() takes no arguments (1 given) 


2.4.2 集合 操作 


Python 集合 支持 交集 .并 集 和 差 集 等 运算 ,读者 结合 在 其 他 课程 中 学 过 的 集合 知识 ,应 


该 不 难 理解 下 面 的 代码 。 
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>>>a_set 

set([8, 9, 10, 11, 12, 13]) 
>>>b set 

set([0, 1, 2, 3, 7, 8]) 


»»»a set.union(b set) # 并 集 
set (I0, 1, 2, 3, 7, 8, 9, 10, 11, 12, 13]) 

»»»a set&b set IZE 
set ([8]) 

>>>a_set intersection (b set) # 交 集 
set([8]) 

>>>a_set.difference (b_set) # 差 集 
set([9, 10, 11, 12, 13]) 

>>>a_set.symmetric difference(b set) 3X ERE 


set([O, 1, 2, 3, 7, 9, 10, 11, 12, 13]) 


Python 数据 结构 


»»»a set^b set 


set([0, 1, 2, 3, 7, 9, 10, 11, 12, 13]) 


作为 集合 的 具体 应 用 ,可 以 使 用 集合 快速 提取 序列 中 的 单一 元 素 , 即 提取 出 序列 中 所 有 
不 重复 的 元 素 , 如 果 使 用 传统 方式 的 话 , 需 要 编写 下 面 的 代码 : 


>>> import random 
>>> ListRandom = [random.choice (range (10000)) for i in range (100) ] 
»»»noRepeat = [] 
>>> for i in listRandom : 

if i not in noRepeat : 

noRepeat .append (i) 

>>> len (listRandom) 
>>> len (noRepeat) 


如 果 使 用 集合 的 话 , 只 需要 如 下 一 行 代 码 就 可 以 了 ,可 以 参考 上 面 的 代码 对 结果 进行 


>>> newSet = set (listRandom) 


2.5 其 他 数据 结构 


在 应 用 开发 中 ,除了 Python 基本 序列 之 外 ,还 经 常 需要 使 用 到 其 他 一 些 数据 结构 , 例 
如 堆 、 栈 .队列 . 树 和 图 等 。 其 中 有 些 结构 Python 本 身 已 经 提供 了 ,而 有 些 则 需要 自己 利用 
Python 基本 序列 来 实现 。 本 节 内 容 可 以 看 作 是 Python 序列 ,元 组 等 基本 数据 结构 的 扩展 ， 
或 者 Python 基本 数据 结构 的 二 次 开发 。 这 里 假设 您 对 数据 结构 的 知识 有 所 了 解 , 因 此 有 
些 基 本 概念 就 不 做 过 多 的 解释 了 ,如 果 需 要 的 话 , 可 自行 查阅 有 关 资 料 。 当 然 , 也 可 以 参考 
本 节 的 思路 自己 编写 代码 来 实现 数据 结构 课程 中 更 加 复杂 的 数据 结构 。 


2.5.1 HW 


堆 是 一 种 重要 的 数据 结构 ,在 进行 排序 时 使 用 较 多 ,Python 在 heapq 模块 中 提供 了 对 
堆 的 支持 。 下 面 的 代码 演示 了 堆 的 用 法 ,同时 也 请 读者 注意 random 模块 的 用 法 。 


>>> import heapq 

»»» import random 

>>> data = range (10) 

>>> data 

[055 Bip. 29 Bp Ay 15516; E E 

>>> random. choice (data) # 随 机 选择 
9 

>>> random.choice (data) 

i 

>>> random. shuffle (data) +F 
>>>data 

[6, 1, 3, 4, 9, 0, 5, 2, 8, 7] 
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>>>heap = [] 
>>> for nin data: # 建 堆 


heapq.heappush (heap, n) 
»»»heap 
[0, 2, 1, 4, 7, 3, 5, 6, 8, 9] 
»»»heapq.heappush (heap, 0.5) 
»»»heap 
[0,. 0.5, 1, 4,.2; 3, 5; 6; 8, 9, 7] 
»»»heapq.heappop (heap) # 弹 出 最 小 的 元 素 
0 
>>> heapq.heappop (heap) 
0.5 
>>> heapq.heappop (heap) 
1 
>>>myheap = [1,2,3,5, 7,8,9, 4,10, 333] 
»»»heapq.heapi fy (myheap) 
>>>myheap 
[1, 2, 3, 4, 7, 8, 9, 5, 10, 333] 
>>> heapq.heapreplace (myheap, 6) 
1 
>>>myheap 
[2, 4, 3, 5, 7, 8, 9, 6, 10, 333] 


2.5.2 队列 


队列 的 特点 是 “先进 先 出 (FIFO)” 和 “后 进 后 出 (LILO)”, 在 某 些 应 用 中 有 着重 要 的 作 
用 ,例如 多 线程 编程 ,作业 处 理 等 。Python 提供 了 Queue 模块 (在 Python 3 中 为 queue) RI 
collections. deque 模块 支持 队列 的 操作 ,当然 也 可 以 使 用 Python 列表 进行 二 次 开发 来 实现 
自 定义 的 队列 结构 。 例 如 ,下 面 的 代码 演示 了 Queue 模块 的 用 法 。 


>>> import Queue # queue in Python3 
>>> q= Queue .Queue () 
>>>q.put (0) 
>>>q.put (1) 
>>>q.put (2) 

>>> print q.queue 
deque ([0, 1, 2]) 
>>>print q.get () 

0 

>>>print q.queue 
deque ([1, 2]) 
»»»print q.get () 

1 

>>>print q.queue 
deque ([2]) 


下 面 的 代码 使 用 了 collections 模块 的 双 端 队列 
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>>> from collections import deque 
>>> queue =deque (["Eric", "John", "Michael"]) 
>>> queue append ("Terry") 

>>> queue -append ("Graham") 

>>> queue.popleft () 

‘Eric’ 

>>> queue.popleft () 

"John" 

>>> queue 

deque(['Michael', 'Terry', 'Graham']) 


下 面 的 类 利用 Python 列表 实现 了 自 定义 的 队列 结构 : 


class myQueue: 
def init (self, size =10): 
self. content = [] 
Self. size =size 
def setSize(self, size): 
self. size =size 
def put (self, v): 
if len(self. content) «self. size: 
self. content.append(v) 
else: 
print 'The queue is full' 
def get (self): 
if self. content: 
return self. content.pop (0) 
else: 
print 'The queue is empty" 
def show (self): 
if self. content: 
print self. content 
else: 
print 'The queue is empty" 
def empty (self): 
self. content - [] 
def isEmpty (self): 
if not self. content: 
return True 
else: 
return False 
def isFull (self): 
if len(self. content) ==self. size: 
return True 
else: 


return False 
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可 以 使 用 该 类 的 方法 来 实现 队列 的 基本 操作 ,也 可 以 进行 扩展 以 实现 其 他 特殊 需求 。 
下 面 的 代码 简单 演示 了 这 个 自 定义 队列 结构 的 用 法 : 


>>> import myQueue 
>>> q =myQueue .myQueue () 
»»»q.get() 

The queue is empty 
»»»q.put (5) 
»»»q.show() 

[5] 

>>>q.put (7) 
>>>q.put('a') 
»»»q.show() 

[5, 7, 'a'] 
»»»q.isEmpty() 
False 
»»»q.isFull() 
False 

>>>q.get () 

5 

>>> q.get () 

7 

>>>q.get () 

tar 

>>>q.get () 

The queue is empty 


2.5.3 栈 


栈 是 一 种 “后进 先 出 (LIFO)? 或 “先进 后 出 (FILO)” 的 数据 结构 ,Python 列表 本 身 就 可 
以 实现 栈 结构 的 基本 操作 。 列 表 对 象 的 appendO) 方 法 是 在 列表 尾部 追加 元 素 ,类似 于 入 栈 
操作 ;pop() 方 法 默认 是 弹出 并 返回 列表 的 最 后 一 个 元 素 ,类 似 于 出 栈 操作 。 但 是 直接 使 用 
Python 列表 对 象 模拟 栈 操作 并 不 太 方便 ,例如 当 列 表 为 空 时 再 执行 pop() 则 会 殷 出 一 个 不 
很 友好 的 异常 ;另外 ,也 无 法 限制 列表 对 象 的 大 小 。 


>>>myStack = [] 
»»»myStack.append(3) 
»»»myStack.append (5) 
»»»myStack.append(7) 
>>>myStack 

[3, 5, 7] 
»»»myStack.pop () 

7 

>>>myStack.pop () 

5 

>>>myStack.pop () 
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3 
>>>myStack.pop () 
Traceback (most recent call last) : 
File "<pyshell# 85>", line 1, in «module» 
myStack.pop () 
IndexError: pop from empty list 


下 面 的 代码 使 用 Python 列表 实现 了 自 定义 的 栈 结构 来 模拟 栈 的 操作 : 


class Stack: 
def init (self, size =10): 
self. content = [] 
self. size =size 
def empty (self): 
self. content - [] 
def isEmpty (self): 
if not self. content: 
return True 
else: 
return False 
def setSize(self, size): 
Self. size =size 
def isFull(self): 
if len(self. content) -- self. size: 
return True 
else: 
return False 
def push (self, v): 
if len(self. content) «self. size: 
self. content.insert (0, v) 
else: 
print 'Stack Full!" 
def pop (self): 
if len(self. content) >0: 
v=self. content[0] 
del self. content [0] 
return v 
else: 
print 'Stack is empty!" 
def show (self): 


print self. content 


将 上 面 代码 保存 为 Stack. py 文件 之 后 ,可 以 作为 模块 进行 使 用 来 模拟 栈 的 基本 操作 。 


当然 ,也 可 以 在 上 面 代码 的 基础 上 进行 扩展 以 实现 您 的 想法 : 


>>> import stack 
>>>s =Stack.Stack() 
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>>>s.push (3) 
»»»s.show() 
[3] 

>>> s.push (5) 
>>> s.show() 
[5, 3] 

>>> s.push (7) 
»»»s.show() 
U, 5, 3] 

>>> s-pop() 

7 

>>>s.show () 


(5, 3] 


2.5.4 链表 


可 以 直接 使 用 Python 列表 及 其 基本 操作 来 实现 链表 的 功能 ,当然 也 可 以 对 列表 进行 
封装 来 实现 自 定义 的 链表 结构 。 下 面 的 代码 使 用 Python 列表 模拟 了 链表 及 其 基本 操作 : 


>>> linkTable = [] 

»»»linkTable.append(3) # 在 尾部 追加 节点 
>>> linkTable.append (5) 

>>> linkTable 

B, 5] 

»»»linkTable.insert (1,4) # 在 链表 中 间 插 人 节点 
>>> linkTable 

[3, 4, 5] 

>>> LinkTable. remove (linkTable[1]) S 删除 节点 

>>> linkTable 

[3, 5] 


2.5.5 IXH 


如 果 学 过 数据 结构 的 话 , 大 家 肯定 还 对 当时 的 痛苦 记忆 犹 新 ,用 C/C++ 来 实现 二 又 树 
要 考虑 很 多 问题 ,看 到 下 面 使 用 Python 实现 的 二 又 树 ,相信 和 您 会 眼前 一 亮 。 


class BinaryTree: 

def init (self, value): 
self. left =None 
self. right =None 
self. data value 

def insertLeftChild(self, value): 
if self. left: 

print' left child tree already exists.' 

else: 


self. left =BinaryTree (value) 
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return self. left 
def insertRightChild (self, value): 
ifself. right: 
print 'Right child tree already exists." 
else: 
self. right =BinaryTree (value) 
return self. right 
def show (self): 
print self. data 
def preOrder (self): 
print self. data 
ifself. left: 
Self. left.preOrder() 
if self. right: 
self. right.preOrder() 
def postOrder (self): 
if self. left: 
Self. left.postOrder() 
if self. right: 
self. right.postOrder() 
print self. data 
def inOrder (self): 
if self. left: 
self. left.inOrder() 
print self. data 
ifself. right: 
Self. right.inOrder() 
if name --' main ': 


print 'Please use me as a module. ' 


可 以 看 出 ,这 段 代 码 是 把 print 作为 输出 语句 来 使 用 的 ,可 以 不 进行 任何 修改 地 运行 于 
Python 2, 如 果 您 用 的 是 Python 3, 仅 需要 把 print 语句 改 为 print() 函数 即 可 ,前 面 有 过 类 
似 的 说 明 ,这 里 就 不 再 费 述 了 。 假 设 把 上 面 的 代码 保存 为 文件 Binary Tree. py, 然 后 可 以 使 
用 下 面 的 方法 来 使 用 上 面 定义 的 二 又 树 类 。 要 注意 的 是 ,需要 把 这 个 文件 放 在 Python 的 
安装 目录 中 ,或 者 把 含有 该 文件 的 目录 添加 到 sys. path 中 。 


>>> import BinaryTree 

>>> root -BinaryTree.BinaryTree ('root') 

>>> firstLeft —root.insertleftChild('A') 

>>> firstRight —root.insertRightChild('B') 

>>> secondLeft =firstLeft.insertLeftChild('C') 
>>> thridRight = secondLeft.insertRightChild('"D') 
>>> root .postOrder () 

D 

e 
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root 


>>> root.inOrder () 


root 


2.5.6 有 向 图 

作为 本 章 的 最 后 一 个 示例 ,让 我 们 来 看 一 下 使 用 Python 语言 实现 有 向 图 的 创建 和 路 
径 搜索 。 有 向 图 由 节点 和 边 组 成 ,而 每 条 边 都 是 有 方向 的 ,两 个 节点 之 间 存 在 有 向 边 则 表示 
可 以 从 起 点 到 达 终 点 。 与 二 叉 树 的 示例 一 样 ,这 里 给 出 稍微 完整 的 代码 。 


#- * -coding:utf- 8 - * — 
# Filename: DirectedGraph.py 


4- 
def searchPath (graph, start, end): 
results - [] 
. generatePath (graph, [start], end, results) 
results.sort (key = lambda x:len(x)) 
return results 
def generatePath (graph, path, end, results): 
current =path[- 1] 
if current -- end: 
results.append (path) 
else: 
for n in graph [current]: 
if n not in path: 
$ path.append (n) 
. generatePath (graph, path + [n], end, results) 
def showPath (results): 
print 'The path from ',results[0][0], ' to ', results[0][-1], ' is:' 
for path in results: 
print path 


if name ^ main ': 
graph ={'A':["B', 'C', 'D'], 
"B'i['E!], 
a ted, 
DH [5BY, YE, 6T, 
"E's [IG], 
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SES pp", 6, 

"G's[E', "A', "B'1) 
r =searchPath (graph, 'A', 'D') 
showPath (r) 


为 了 节省 篇 幅 ,您 可 以 自行 运行 该 程序 ,并 结合 运行 结果 来 理解 这 段 代 码 。 


本 章 知 识 精 要 


a 


CD WR FFE EB ARLERI 

(2) 列表 .字典 和 集合 属于 可 变 序 列 , 元 组 和 字符 串 属于 不 可 变 序列 。 

(3) 如 果 有 可 能 ,应 尽量 从 列表 的 尾部 进行 元 素 的 增加 与 删除 操作 。 

(4) 切片 操作 不 仅 可 以 用 来 返回 列表 、 元 组 .字符 串 中 的 部 分 元 素 , 还 可 以 对 列表 中 的 
元 素 值 进行 修改 ,以 及 增加 或 删除 列表 中 的 元 素 。 

(5) 列表 推导 式 可 以 使 用 简洁 的 形式 来 生成 满足 特定 需要 的 列表 。 

(6) 序列 解 包 在 多 个 场合 具有 重要 的 应 用 ,是 Python 的 基本 操作 之 一 。 

(7) 字典 中 的 元 素 是 键 - 值 对 ,其 中 的 “ 键 "不 允许 重复 。 

(8) 集合 中 的 所 有 元 素 不 允许 重复 。 
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1. 为 什么 应 尽量 从 列表 的 尾部 进行 元 素 的 增加 与 删除 操作 ? 

2. 编写 程序 ,生成 包含 1000 个 0 一 100 之 间 的 随机 整数 ,并 统计 每 个 元 素 的 出 现 次 数 。 

3. 编写 程序 ,用 户 输入 一 个 列表 和 两 个 整数 作为 下 标 , 然 后 输出 列表 中 介 于 两 个 下 标 
之 间 的 元 素 组 成 的 子 列表 。 例 如 ,用 户 输入 [1,2.3,4,5,6] 和 2、5 ,程序 输出 [3,4,5,6]。 

4. 设计 一 个 字典 ,并 编写 程序 ,用 户 输入 内 容 作 为 键 ,然后 输出 字典 中 对 应 的 值 ,如 果 
用 户 输入 的 键 不 存在 , 则 输出 “您 输入 的 键 不 存在 1”。 

5. 编写 程序 ,生成 包含 20 个 随机 数 的 列表 ,然后 将 前 10 个 元 素 升序 排列 ,后 10 个 元 
素 降序 排列 ,并 输出 结 

6. 在 Python 中 ,字典 和 集合 都 是 用 一 对 作为 界定 符 , 字 典 的 每 个 元 素 有 两 部 
分 组 成 , 即 和 ,其 中 不 允许 重复 。 

7. 假设 有 列表 a=['name','age’,'sex'] Ail b—['"Dong'.38.'Male'] ,请 使 用 一 个 语句 将 这 两 
个 列表 的 内 容 转换 为 字典 ,并 且 以 列表 a 中 的 元 素 为 键 ,以 列表 b 中 的 元 素 为 值 ,这 个 语句 
可 以 写 为 。 

8. 假设 有 一 个 列表 a, 现 要 求 从 列表 a 中 每 3 个 元 素 取 1 个 ,并 且 将 取 到 的 元 素 组 成 新 
的 列表 b, 可 以 使 用 语句 。 

9. 使 用 列表 推导 式 生成 包含 10 个 数字 5 的 列表 ,语句 可 以 写 为 。 

10. (可 以 \ 不 可 以 ) 使 用 del 命令 来 删除 元 组 中 的 部 分 元 素 。 


第 3 章 选择 与 循环 


在 传统 的 面向 过 程 程序 设计 中 有 3 种 经 典 的 控制 结构 , 即 顺序 结构 .选择 结构 和 循环 结 
构 。 即 使 在 面向 对 象 程序 设计 语言 中 以 及 事件 驱动 或 消息 驱动 应 用 开发 中 ,也 无 法 脱离 这 
3 种 基本 的 程序 结构 。 可 以 说 ,不 管 使 用 哪 种 程序 设计 语言 ,在 实际 开发 中 ,为 了 实现 特定 
的 业务 逻辑 或 算法 ,都 不 可 避免 地 要 用 到 大 量 的 选择 结构 和 循环 结构 ,并 且 经 常 需 要 将 选择 
结构 和 循环 结构 嵌 套 使 用 。 在 本 章 中 ,首先 介绍 Python 中 选择 结构 与 循环 结构 的 语法 , 然 
后 通过 几 个 示例 来 理解 其 用 法 。 


3.1 运算 符 与 条 件 表达 式 


在 选择 结构 和 循环 结构 中 ,都 要 使 用 条 件 表达 式 来 确定 下 一 步 的 执行 流程 。 在 条 件 表 
达 式 中 可 以 使 用 1. 4. 5 节 介 绍 的 如 下 所 有 运算 符 。 

OD 算术 运算 符 : 十 、 一 、* IS. 

(2) 关系 运算 符 : >.<. HVS = LHI. 

(3) 测试 运算 符 : in、not in is,is not, 

CA) 32 Sis SEE: and、or、not。 

(5) 位 运算 符 : ~~、&、|、^、 RI. 

在 选择 和 循环 结构 中 ,条 件 表达 式 的 值 只 要 不 是 False 0R 0. 0.0) 等 ). 空 值 None、 空 
列表 、 空 元 组 、 空 集合 、 空 字典 、 空 字符 串 或 其 他 空 序列 ,Python 解释 器 均 认为 与 True 等 价 。 
从 这 个 意义 上 来 讲 , 几 乎 所 有 的 Python 合法 表达 式 都 可 以 作为 条 件 表达 式 。 例 如 : 


>>>if 3: 
print (5) 
5 
>>>a = [1,2,3] 
>>>if a: 
print (a) 
(1, 2, 3] 
>>>a=[] 
>>>if a: 
print a 
else: 


print 'empty" 


empty 
>>>i=s=0 
>>>while i <=10: 


s+=i 
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it-1 
>>>print s 
55 
>>>i=s=0 
>>>while True: 
st+=i 
i+=1 
if i> 10: 
break 
>>>print s 
55 
>>>s =0 
>>> for i in range(0,11,1): 
st=i 
>>>print s 
55 


关于 表达 式 和 运算 符 的 详细 内 容 在 1. 4.5 节 中 已 有 介绍 OES EGS , R ANA 
下 条 件 表达 式 中 比较 特殊 的 几 个 运算 符 。 首 先是 关系 运算 符 , 与 很 多 语言 不 同 的 是 ,在 
Python 中 的 关系 运算 符 可 以 连续 使 用 ,例如 : 


>>>print 1<2<3 
True 

>>>print 1<2>3 
False 

>>>print 1<3>2 


True 


比较 特殊 的 运算 符 还 有 逻辑 运算 符 and 和 or, 这 两 个 运算 符 具有 短路 求 值 或 惰性 求 值 
的 特点 ,简单 地 说 ,就 是 只 计算 必须 计算 的 表达 式 的 值 。 在 设计 条 件 表达 式 时 ,在 遇 到 复杂 
条 件 时 如 果 能 够 巧妙 利用 旭 辑 运算 符 and 和 or 的 短路 求 值 或 惰性 求 值 特性 ,可 以 大 幅度 提 
高 程序 的 运行 效率 ,减少 不 必要 的 计算 与 判断 。 以 and 为 例 ,对 于 表达 式 “ 表 达 式 1 and X 
达 式 2” 而 言 ,如果 “ 表 达 式 1” 的 值 为 False 或 其 他 等 价值 时 ,不 论 “表达 式 2” 的 值 是 什么 , 整 
个 表达 式 的 值 都 是 False, 此 时 “表达 式 2” 的 值 无 论 是 什么 都 不 影响 整个 表达 式 的 值 ,因此 
将 不 会 被 计算 ,从 而 减少 不 必要 的 计算 和 判断 。 逻 辑 或 运算 符 or 也 具有 类 似 的 特点 ,读者 
可 以 自行 分 析 。 在 设计 条 件 表达 式 时 ,如 果 能 够 大 概 预测 不 同 条 件 失败 的 概率 ,并 将 多 个 条 
件 根据 and 和 or 运算 的 短路 求 值 特性 进行 排序 ,可 以 大 幅度 提高 程序 的 运行 效率 。 例 如 ， 
下 面 的 函数 用 来 使 用 用 户 指定 的 分 隔 符 将 多 个 字符 串 连接 成 一 个 字符 串 , 如 果 用 户 没 有 指 
定 分 隔 符 则 使 用 逗号 。 


>>> def Join(chList, sep=None) : 
return (sep or ',').join(chList) 

>>>chTest = ['1', '2*, '3', '4','5'] 

>>> Join (chTest) 

51,2,3,4;5* 
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>>> Join (chTest, ' :') 
11:2:3:4:5' 
»»»Join(chTest,' ') 
12345 


当然 ,还 可 以 把 上 面 的 函数 直接 定义 为 下 面 的 形式 : 


>>> def Join(chList, sep=','): 


return sep.join (chList) 


3.2 选择 结构 


选择 结构 通过 判断 某 些 特定 条 件 是 否 满足 来 决定 下 一 步 的 执行 流程 ,是 非常 重要 的 控 
制 结构 。 常 见 选择 结构 的 有 单 分 支 选择 结构 、 双 分 支 选择 结构 .多 分 支 选 择 结构 、 嵌 套 的 分 
支 结构 ,形式 比较 灵活 多 变 , 具 体 使 用 哪 一 种 最 终 取 决 于 要 实现 的 业务 逻辑 。 从 某 种 意义 上 
讲 , 后 面 章节 中 讲 到 的 循环 结构 和 异常 处 理 结构 中 也 可 以 带 有 else 子 句 ,可 以 看 作 是 选择 
结构 的 一 种 变形 。 

3.2.1 单 分 支 选择 结构 

单 分 支 选择 结构 是 最 简单 的 一 种 形式 ,其 语法 如 下 所 示 , 其 中 的 冒号 是 不 可 缺少 的 , 表 
示 一 个 语句 块 的 开始 。 

证 表达 式 : 

语句 块 

当 表达 式 值 为 True 或 其 他 等 价值 时 ,表示 条 件 满足 ,语句 块 将 被 执行 ,否则 该 语句 块 
将 不 被 执行 。 

a,b= input ('Input two numbers:') 

if a»b: 


a,b-b,a 


print a,b 
3.2.2 双 分 支 选择 结构 


双 分 支 选择 结构 的 语法 为 


if 表达 式 : 
语句 块 1 
else: 
语句 块 2 
当 表 达 式 的 值 为 True 或 其 他 等 价值 时 ,执行 语句 块 1 ,否则 执行 语句 块 2。 该 结构 类 似 
于 下 面 的 表达 式 语法 : 


valuel if condition else value2 
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例如 : 


>>>a =5 
>>>print (6) if a>3 else print (5) 
6 
>>>print (6 if a>3 else 5) 
6 
>>>b =6 if a>13 else 9 
>>>b 
9 
»»»chTest = ['1', '2', '3', "4", '5'] 
»»»if chTest: 
print chTest 
else: 
print 'Empty' 
pro iar a, MeL ih 


3.2.3 多 分 选择 支 结构 


多 分 支 选 择 结构 为 用 户 提供 了 更 多 的 选择 ,可 以 实现 复杂 的 业务 逻辑 ,多 分 支 选择 结构 
的 语法 为 
if 表达 式 1: 
语句 块 1 
elif 表达 式 2: 
语句 块 2 
elif 表达 式 3: 
语句 块 3 


else: 


语句 块 n 
其 中 ,elif 是 else if 的 缩写 。 下 面 的 代码 演示 了 利用 多 分 支 选 择 结构 将 成 绩 从 百分制 变换 
到 等 级 制 的 用 法 。 


>>> def func (score) : 
if score » 100: 
return "wrong score.must <=100.' 
elif score >=90: 
return 'A' 
elif score >=80: 
return 'B' 
elif score »- 70: 
return 'C' 
elif score >=60: 
return 'D' 


elif score >=0: 


67 


《Python 程序 设计 》 


return 'E' 
else: 
return "wrong score.must » 0" 

>>> func (120) 
"wrong score.must <=100." 
>>> func (99) 
"Ar 
>>> func (87) 
"Br 
>>> func (62) 
"p 
>>> func (3) 
"Et 
>>> func (- 10) 


"wrong score.must >0' 


3.2.4 ”选择 结构 的 嵌 套 
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选择 结构 可 以 进行 嵌 套 ,语法 如 下 : 


证 表达 式 1: 
语句 块 1 
if 表达 式 2: 
语句 块 2 
else: 
语句 块 3 
else: 
if 表达 式 4: 
语句 块 4 


使 用 该 结构 时 ,一 定 要 严格 控制 好 不 同 级 别 代 码 块 的 缩 进 量 ,因为 这 决定 了 不 同 代码 块 
的 从 属 关 系 以 及 业务 好 辑 是 否 被 正确 地 实现 ,是否 能 够 被 Python 正确 理解 。 例 如 ,3. 2. 3 
节 中 百分制 转 等 级 制 的 示例 ,作为 一 种 编程 技巧 ,还 可 以 尝试 下 面 的 写法 : 


>>> def func (score): 
degree = 'DCBAAE' 


if score >100 or score «0: 


return "wrong score.must between 0 and 100." 


else: 
index = (score - 60) //10 
if index >=0: 
return degree [index] 
else: 
return degree[- 1] 
>>> func (- 10) 


"wrong score.must between 0 and 100." 
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>>> func (30) 
"Ri 

»»» func (50) 
"Ri 

»»» func (60) 
"p! 

»»» func (93) 
"C 

»»» func (100) 
x 


3.2.5 选择 结构 应 用 
【 例 3-1】 面试 资格 确认 。 


age =24 
subject = "计算 机 " 
college =" 非 重点 " 


if (age >25 and subject==" 电 子 信息 工程 ") or (college==" 重 点 " and subject==" 电 子 信 息 工 程 " 
) or (age<=28 and subject- - "计算 机 ") : 

print (" 恭 喜 , 你 已 获得 我 公司 的 面试 机 会 !) 
else: 


print ("8 aK . f A35 Bl rio iX BER") 


【 例 3-2〗 用 户 输入 若干 个 成 绩 , 求 所 有 成 绩 的 总 和 。 每 输入 一 个 成 绩 后 询问 是 否 继 
续 输 入 下 一 个 成 绩 ,回答 yes 就 继续 输入 下 一 个 成 绩 ,回答 no 就 停止 输入 成 绩 。 下 面 的 示 
例 代 码 使 用 Python 2. 7. 8 编写 ,读者 可 以 很 容易 地 修改 为 Python 3. x 的 版 本 。 


import types 
endFlag -'yes' 
s=0 
while endFlag.lower() ==' yes': 
x = input (" 请 输入 一 个 正 整 数 : ") 
if type(x) ==types.IntType and 0<=x<=100: 
s-stx 
else: 
print ' 不 是 数字 或 不 符合 要 求 ' 
endFlag = raw_input (" 继 续 输入 ? (yes or no) ') 
print "整数 之 和 = is 


3.3 循环 结构 


Python 提供 了 两 种 基本 的 循环 结构 : while 循环 和 for 循环 。 其 中 ,while 循环 一 般 用 
于 循环 次 数 难 以 提前 确定 的 情况 ,当然 也 可 以 用 于 循环 次 数 确 定 的 情况 ;for 循环 一 般 用 于 
循环 次 数 可 以 提前 确定 的 情况 .尤其 适用 于 枚 举 或 遍历 序列 或 迭代 对 象 中 的 元 素 ; 编 程 时 一 
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般 建议 优先 考虑 使 用 for 循环 。 相同 或 不 同 的 循环 结构 之 间 可 以 互相 嵌 套 ,也 可 以 与 选择 
结构 嵌 套 使 用 ,用 来 实现 更 为 复杂 的 逻辑 。 
while 循环 和 for 循环 常见 的 用 法 为 
while 表达 式 : 
循环 体 


for 变量 in 序列 或 其 他 迭代 对 象 : 
循环 体 


另外 ,while 循环 和 for 循环 都 可 以 带 else 子 句 ,如 果 循 环 因为 条 件 表达 式 不 成 立 而 自 
然 结 束 ( 不 是 因为 执行 了 break 而 结束 循环 ) 时 则 执行 else 结构 中 的 语句 ,如 果 循 环 是 因为 
执行 了 break 语句 而 导致 循环 提前 结束 则 不 执行 else 中 的 语句 。 其 语法 形式 为 


while 表达 式 : 
循环 体 
else: 


else 子 句 
和 


for 取 值 in 序列 或 迭代 对 象 : 
循环 体 
else: 


else 子 句 


例如 ,下 面 的 代码 演示 了 带 有 else 子 句 的 循环 结构 ,该 代码 用 来 计算 1 十 2 十 3 十 … 十 
99 十 100 的 结果 。 


>>>s =0 

>>> for i in range(1,101): 
s+=i 

else: 
print s 

5050 


下 面 的 代码 使 用 while 循环 实现 了 同样 的 功能 : 


»»»s-i-0 
>>>while i <=100: 
s+=i 
i+=1 
else: 
print s 


5050 


为 了 优化 程序 以 获得 更 高 的 效率 和 运行 速度 ,在 编写 循环 语句 时 ,应 尽量 减少 循环 内 部 
不 必要 的 计算 ,将 与 循环 变量 无 关 的 代码 尽 可 能 地 提取 到 循环 之 外 ,如 果 不 得 不 使 用 多 重 循 
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环 嵌 套 时 ,应 尽量 减少 内 层 循环 中 不 必要 的 计算 , 尽 可 能 地 向 外 提 ; 另 外 ,在 循环 中 应 尽量 引 
用 局 部 变量 ,因为 局 部 变量 的 查询 和 访问 速度 比 全 局 变量 略 块 ,在 使 用 模块 中 的 方法 时 ,可 
以 通过 将 其 转换 为 局 部 变量 来 提高 运行 速度 ,例如 : 


import time 
import math 
start =time.time() 
for i in xrange (10000000) : 
math.sin (i) 
print ("Time Used:', time.time()- start) 
loc sin =math.sin 
start =time.time() 
for i in xrange (10000000) : 
loc sin(i) 
print ('Time Used:', time.time()- start) 


这 段 代 码 演示 了 模块 方法 的 两 种 不 同调 用 方式 ,并 比较 各 自 的 运行 时 间 ,结果 为 


('Time Used:', 4.9059998989105225) 
('Time Used:', 4.406000137329102) 


您 应 该 还 记得 ,在 第 1 章 还 学 习 过 另外 一 种 导 和 人 和 使 用 模块 成 员 的 方法 ,把 上 面 的 代码 
修改 为 


import time 
from math import sin as sin 
start =time.time() 
for i in xrange (10000000) : 
sin(i) 
print ('Time Used:', time.time()- start) 
loc sin-sin 
start =time.time() 
for i in xrange (10000000) : 
loc sin(i) 


print ('Time Used:', time.time()- start) 
代码 运行 结果 如 下 ,可 以 看 出 ,效率 也 略 有 提高 : 


('Time Used:', 4.608999967575073) 
("Time Used:', 4.4059998989105225) 


3.4 break 和 continue 语句 


break 语句 在 while 循环 和 for 循环 中 都 可 以 使 用 ,一 般 常 与 选择 结构 结合 使 用 ,以 达 
到 在 特定 条 件 得 到 满足 时 跳出 循环 的 目的 。 一 旦 break 执行 语句 ,将 使 得 整个 循环 提前 结 
3. continue 语句 的 作用 是 终止 本 次 循环 ,并 忽略 continue 之 后 的 所 有 语句 ,然后 回 到 循环 
的 顶端 ,提前 进入 下 一 次 循环 。 需 要 注意 的 是 ,过 多 的 break 和 continue 语句 会 严重 降低 程 


71 


《Python 程序 设计 》 


序 的 可 读 性 ,除非 break 或 continue 语句 可 以 让 代码 更 简单 或 更 清晰 ,否则 不 要 轻易 使 用 。 
下 面 的 代码 用 来 计算 小 于 100 的 最 大 素数 ,请 注意 break 语句 和 else 子 句 的 用 法 。 


>>> for n in range(100,1,-1): 

for i in range (2,n): 

if nsi ==0: 

break 

else: 

print n 

break 
97 


删除 上 面 代码 中 最 后 一 个 break 语句 , 则 可 以 用 来 输出 100 以 内 的 所 有 素数 ,例如 : 


>>> for n in range(100,1,- 1) : 
for i in range (2,n) : 
if nti --0: 
break 
else: 
print n, 
97 89 83 79 73 71 67 61 59 53 47 43 41 37 31 29 23 19 17 13117 5 32 


在 编写 循环 结构 代码 时 ,一 定 要 和 警惕 continue 语句 可 能 带 来 的 问题 ,例如 下 面 的 代码 
本 意 是 用 来 输出 10 以 内 的 奇数 : 


>>>i=1 
>>>while i<10: 


if i%2==0: 

continue 
print i 
i+=1 


但 是 由 于 代码 设计 存在 问题 ,从 而 导致 这 个 循环 变 成 了 永 不 结束 的 死 循 环 , 需 要 按 组 合 
键 Ctrl 十 C 来 强行 终止 。 出 现 这 种 情况 的 原因 是 ,一 旦 条 件 表达 式 062 — —0 得 到 满足 以 
后 执行 continue 语句 ,之 后 的 i 十 =1 语句 将 永远 不 再 执行 ,循环 变量 永远 停留 在 当前 的 值 ， 
从 而 使 得 循环 无 法 结束 。 上 面 的 代码 改 成 下 面 这 样 就 不 会 有 问题 了 : 


>>>i=1 
>>>while i<10: 
if i2 ==0: 
i+=1 
continue 
print i, 
i+=1 


13579 


或 者 修改 为 下 面 更 为 简洁 易 理解 的 形式 : 
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>>>i=0 
>>>while i< 10: 
i+=1 
if i%2 ==0: 
continue 
print i, 


13579 
当然 ,也 可 以 使 用 更 简洁 的 for 循环 来 实现 : 


»»»for i in range(10): 
if i$2--0: 
continue 
print i, 
13579 


为 了 充分 理解 ,再 修改 一 下 : 


>>> for i in range (10) : 
if i$2--0: 
it=1 
continue 
print i, 
13579 


在 这 段 代 码 中 ,条 件 语句 中 continue 之 前 的 语句 i+ — 1 并 没有 起 到 任何 作用 。 之 所 以 
会 这 样 ,是 因为 每 次 进入 循环 时 的 变量 i 已 经 不 再 是 上 一 次 的 变量 i, 所 以 修改 其 值 并 不 会 
影响 循环 的 执行 。 下 面 的 代码 很 好 地 描述 了 这 个 问题 : 


>>> for i in range (5) : 

print id(i),':',i 
10416692: 
10416680: 
10416668: 
10416656: 
10416644: 


BWR Oo 


3.5 综合 运用 


本 章 最 后 通过 几 个 示例 来 演示 选择 结构 和 循环 结构 的 用 法 ,正如 前 面 所 说 ,这 两 个 结构 
经 常 需要 互相 结合 来 实现 特定 的 业务 逻辑 。 

[BI 3-3] 计算 1 十 2 十 3 十 … 十 100 的 值 。 

对 于 这 样 比较 规则 的 循环 ,一 般 优先 考虑 使 用 for 循环 ,参考 Python 2.7.8, 代 码 如 下 : 

s=0 

for i in range(1,101): 


s=s +i 
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print '1+2+3+-+100=', s 


print '1+2+3+…+100 =", sum(range(1,101)) 


类 似 的 问题 也 可 以 使 用 while 循环 解决 ,请 参考 前 面 3. 4 节 的 代码 。 
【 例 3-4】 输出 序列 中 的 元 素 。 
对 于 类 似 元 素 遍 历 的 问题 ,一般 也 优先 考虑 使 用 for 循环 ,参考 代码 如 下 : 


a list =['a', 'b', 'mpilgrim', 'z', 'example'] 
for i,v in enumerate (a list): 


print ' 列 表 的 第 ',i+1, ' 个 元 素 是 : v 


对 于 类 似 元 素 遍历 的 问题 ,同样 也 可 以 使 用 while 循环 来 解决 ,但 是 代码 要 麻烦 一 些 ， 
可 读 性 也 较 差 ,例如 : 


>>>a list =['a', 'b', 'mpilgrim', 'z', 'example'] 

>>>i=0 

>>> number -len(a list) 

>>>while i <number: 
print ' 列 表 的 第 '，i+1,' 个 元 素 是 : ', a list [i] 
i+=1 

列表 的 第 1 个 元 素 是 : a 

列表 的 第 2 个 元 素 是 :b 

列表 的 第 3 个 元 素 是 : mpilgrim 

列表 的 第 4 个 元 素 是 : z 

列表 的 第 5 个 元 素 是 : example 


【 例 3-5】 求 1 一 100 之 间 能 被 7 整除 ,但 不 能 同时 被 5 整除 的 所 有 整数 。 
该 例 主要 介绍 条 件 表达 式 的 写法 ,参考 代码 如 下 : 
for i in range(1,101): 
if i %7 ==0 and i $5 !=0: 
print i 
【 例 3-6】 输出 “水 仙 花 数 ”"。 水 仙 花 数 是 指 一 个 3 位 的 十 进 制 数 ,其 各 位 数字 的 立方 和 
等 于 该 数 本 身 。 例 如 ,153 是 水 仙 花 数 ,因为 153 二 1 十 5 十 33。 


for i in range (100,1000) : 
ge =i $10 
shi =i // 10 $10 
bai =i // 100 
if ge* * 3+shi* * 3tbai* * 3==i: 
print i 
【 例 3-7】 求 平均 分 。 
score = [70, 90, 78, 85, 97, 94, 65, 80] 
s=0 


for i in score: 


s*-i 
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print sx 1.0/len (score) 


如 果 您 对 前 面 学 过 的 序列 知识 熟悉 的 话 ,肯定 会 想到 ,其 实 可 以 使 用 下 面 的 内 置 函 数 来 
计算 平均 分 : 


print sum(score) * 1.0/1en (score) 


这 里 之 所 以 需要 将 所 有 元 素 的 和 乘 以 1. 0 转换 为 浮 点 数 ,是 因为 在 Python 2 中 除法 运 
算 符 /的 限制 ,如 果 将 上 面 的 代码 改写 为 Python 3 代码 , 则 不 再 需要 这 个 转换 。 

【 例 3-8】 打印 九 九 乘法 表 。 

该 例 主要 介绍 循环 结构 符 套 用 法 和 循环 条 件 的 控制 ,参考 代码 如 下 : 


for i in range(1,10): 
for j in range (1,i*1): 
print i,'* ',j,'- ',i* j,'Nt', 
print 'An' 
[513-9] 求 200 以 内 能 被 17 整除 的 最 大 正 整 数 。 
IA range() 函数 的 用 法 ,对 于 很 多 循环 来 说 可 能 起 到 事半功倍 的 效果 ,参考 代码 
如 下 : 


for i in range (200,0,- 1) : 
if i$17 ==0: 
print i 


break 
[513-10] 判断 一 个 数 是 否 为 素数 。 


import math 
n —-input ("Input an integer:") 
m =int (math.sqrt (n) * 1) 
for i in range (2,m) : 
if n$i ==0: 

print 'No' 

break 
else: 


print 'Yes' 
本 章 知识 精 要 


CD 几乎 所 有 合法 的 Python 表达 式 都 可 以 作为 选择 结构 和 循环 结构 中 的 条 件 表达 式 。 

(2) 选择 结构 和 循环 结构 往往 会 互相 艇 套 使 用 来 实现 复杂 的 业务 逻辑 。 

(3) 应 优先 考虑 使 用 for 循环 。 

(4) 编写 循环 语句 时 ,应 尽量 减少 内 循环 中 的 无 关 计算 。 

(5) for 循环 和 while 循环 都 可 以 带 有 else 子 句 , 如 果 循 环 因 为 条 件 表 达 式 不 满足 而 自 
然 结束 时 ,执行 else 子 句 中 的 代码 。 
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(6) 除非 break 和 continue 语句 可 以 让 代码 变 得 更 简单 或 更 清晰 ,否则 请 不 要 轻易 
使 用 。 
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1. 分 析 人 逻辑 运算 符 or 的 短路 求 值 特性 。 

2. 编写 程序 ,运行 后 用 户 输入 4 位 整数 作为 年 份 ,判断 其 是 否 为 闽 年 。 如 果 年 份 能 被 
400 整除 , 则 为 羡 年 ;如 果 年 份 能 被 4 整除 但 不 能 被 100 整除 也 为 半年 。 

3. 编写 程序 ,生成 一 个 包含 50 个 随机 整数 的 列表 ,然后 删除 其 中 所 有 奇数 (提示 : 从 后 
向 前 删 ) 。 

4. 编写 程序 ,生成 一 个 包含 20 个 随机 整数 的 列表 ,然后 对 其 中 偶数 下 标的 元 素 进 行 降 
序 排列 ,奇数 下 标的 元 素 不 变 (提示 : 使 用 切片 ) 。 

5. 编写 程序 ,用 户 从 键盘 输入 小 于 1000 的 整数 ,对 其 进行 因 式 分 解 。 例 如 ,10 一 2X5， 
60—2X2X3X5, 

6. 编写 程序 ,至 少 使 用 2 种 不 同 的 方法 计算 100 以 内 所 有 奇数 的 和 。 

7. 编写 程序 ,实现 分 段 函 数 计算 ,如 表 3-1 所 示 。 


表 3-1 分 段 函数 计算 


x y x y 
x<0 0 10<x<20 0. 5x 一 2 
0<x<5 x 20<x 0 


5<x<10 3x 一 5 
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最 早 的 字符 串 编码 是 美国 标准 信息 交换 码 ASCII, 仅 对 10 个 数字 、26 个 大 写 英文 字 
BE 26 个 小 写 英文 字母 及 一 些 其 他 符号 进行 了 编码 。ASCII 采 用 8 位 ( 即 1 个 字 节 ) 来 对 字 
符 进行 编码 ,因此 最 多 只 能 表示 256 个 符号 。 

随 着 信息 技术 的 发 展 和 信息 交换 的 需要 ,各 国 的 文字 都 需要 进行 编码 ,于 是 分 别 设计 了 
不 同 的 编码 格式 ,并 且 编 码 格式 之 间 有 着 较 大 的 区 别 ,其 中 常见 的 编码 有 UTF-8、GB2312、 
GBK、CP936 等 。 采 用 不 同 的 编码 格式 意味 着 把 同一 字符 存 人 文件 时 , 写 入 的 内 容 可 能 会 
不 同 。 其 中 ,UTF-8 编码 是 国际 通用 的 编码 ,以 1 个 字 节 表示 英语 字符 (兼容 ASCID ,以 3 
个 字 节 表示 中 文 及 其 他 语言 ,UTF-8 对 全 世界 所 有 国家 需要 用 到 的 字符 进行 了 编码 。 

GB2312 是 中 国 制定 的 中 文 编 码 , 使 用 1 个 字 节 表示 英语 ,2 个 字 节 表示 中 文 ;GBK 是 
GB2312 的 扩充 ,而 CP936 是 微软 公司 在 GBK 基础 上 完成 的 编码 。GB2312、GBK 和 
CP936 都 是 使 用 2 个 字 节 表示 中 文 ,UTF-8 使 用 3 个 字 节 表 示 中 文 。 在 众多 编码 方案 中 ， 
Unicode 是 不 同 编码 格式 之 间 进 行 互相 转换 的 基础 。 

在 Windows 平 台 上 ,input() 函 数 从 键盘 输入 的 字符 串 默 认为 GBK 编码 ,而 Python 程 
序 中 的 字符 串 编码 则 使 用 # coding 显 式 地 指定 ,常用 的 方式 如 下 : 


# coding-utf- 8 
# coding:GBK 
#- * -coding:utf-8 - * - 


Python 2 对 中 文 支持 不 够 ,因此 常常 需要 在 不 同 的 编码 之 间 互 相 转 换 , 例 如 ,下 面 代 码 
是 在 Python 2. 7. 8 环境 下 执行 的 结果 : 


>>>sl=' 中 国 ' 

>>>sl 
"\xd6\xd0\xb9\xfa" 

>>> len (s1) 

4 

>>> s2= s1.decode ('GBK') 
>>> s2 

u'\u4e2d\u5é6fd' 

>>> len (32) 


2 


>>> s3=s2.encode ('UTF- 8") 
>>>s3 
"\xe4\xb8\xad\xe5\x9b\xbd" 
>>> len (s3) 

6 


>>>print s1,52,53 
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中 国 中 国 中 国 


Python 3 中 则 完全 支持 中 文 ,无 论 是 一 个 数字 、 英 文字 母 ,还 是 一 个 汉字 ,都 按 一 个 符 
号 对 待 和 人 处理。 例如 ,在 Python 3. 4. 2 环境 中 执行 下 面 的 代码 : 


>>>s =' 中 国 山东 烟台 " 

>>> len (s) 

6 

>>> s = 'SDIBT' 

>>> len (s) 

5 

>>>s = ' 中 国 山东 烟台 SDIBT' 
>>> len (s) 


11 
4.1 字 fF R 


在 Python 中 ,字符 串 属于 不 可 变 序列 类 型 ,使 用 单 引 号 、 双 引号 .三 单 引号 或 三 双 引 号 
作为 界定 符 ,并 且 不 同 的 界定 符 之 间 可 以 互相 嵌 套 。 除 了 支持 序列 通用 方法 (包括 比较 、. 计 
算 长 度 、. 元 素 访问 和 分 片 等 操作 ) 以 外 ,字符 串 类 型 还 支持 一 些 特有 的 操作 方法 ,例如 格式 化 
操作 字符 串 查找 .字符 串 替 换 等 。 但 由 于 字符 串 属于 不 可 变 序列 ,不 能 对 字符 串 对 象 进行 
元 素 增 加 、 修 改 与 删除 等 操作 。 字 符 串 对 象 提供 的 replace() 和 translate() 方 法 并 不 是 对 原 
字符 串 直接 进行 修改 蔡 换 ,而 是 返回 一 个 修改 替换 后 的 结果 字符 串 ,并 不 对 原 字 符 串 做 任何 
改动 。 

Python 支持 字符 串 驻 留 机 制 , 即 : 对 于 短 字 符 串 ,将 其 赋值 给 多 个 不 同 的 对 象 时 ,内 存 
中 只 有 一 个 副本 ,多 个 对 象 共享 该 副本 。 这 一 点 不 适用 于 长 字符 串 , 即 长 字符 串 不 遵守 驻 留 
机 制 ,下 面 的 代码 演示 了 短 字符 串 和 长 字符 串 在 这 方面 的 区 别 : 

>>>a ='1234" 

>>>b = '1234' 

>>>id(a) ==id(b) 

True 

>>>a ='1234' * 50 

>>>b = '1234' * 50 

>>>id(a) ==id(b) 

False 


如 果 需 要 判断 一 个 变量 s 是 否 为 字符 串 ,应 使 用 isinstance(s，basestring) 。 在 Python 
3 之 前 ,字符 串 有 str 和 Unicode 两 种 ,其 基 类 都 是 basestring, 在 Python 3 之 后 合 二 为 一 
T. f£ Python 3 中 ,程序 源 文件 默认 为 UTF-8 编码 ,全 面 支持 中 文 , 字 符 串 对 象 不 再 有 
encode 和 decode 方法 。 甚 至 在 Python 3 中 可 以 使 用 中 文 作为 变量 名 。 下 面 的 代码 演示 了 
Python 2.7. 8 中 的 字符 串 类 型 : 


>>> import types 
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>>> types.StringType 

«type 'str'> 

>>>basestring 

«type 'basestring'> 

>>>s ="hello world' 

>>> isinstance (s,basestring) 
True 

>>> type(s) 

«type 'str'> 

>>> type(s) ==types.StringType 
True 

>>> ss =u'hello world' 

>>> type (ss) 

«type 'unicode'» 

>>> isinstance (ss,basestring) 
True 

>>> type (ss) ==types.UnicodeType 
True 

>>> type (ss) ==types.StringType 
False 


4.1.1 字符 串 格式 化 


如 果 需 要 将 其 他 类 型 数据 转换 为 字符 串 或 另 一 种 数字 格式 ,或 者 戏 入 其 他 字符 串 或 模 
板 中 再 进行 输出 ,就 需要 用 到 字符 串 格式 化 。Python 中 字符 串 格式 化 的 格式 如 图 4-1 所 
示 ,% 符 号 之 前 的 部 分 为 格式 字符 串 ,% 之 后 的 部 分 为 需要 进行 格式 化 的 内 容 。 
'% [-] [+] [0] [m] Ln] 格式 字符 "6 x 


- (1) 待 转换 的 表达 式 
Q) 格式 运算 符 
(3) 指定 类 型 


(4) 指定 精度 

6 小 宽度 

(6) 指定 空位 填 0 

(7) 对 正 数 加 正 号 

(8) 指定 左 对 齐 输出 

(9) 格式 标志 ,表示 格式 着 始 


4-1 字符 串 格式 化 


与 其 他 语言 一 样 ,Python 支持 大 量 的 格式 字符 ,常见 的 格式 字符 如 表 4-1 所 示 。 
表 4-1 常见 的 格式 字符 


格式 字符 说 明 格式 字符 说 明 
%s 字符 串 ( 采 用 str() 的 显示 ) %e 单个 字符 
%r 字符 串 ( 采 用 repr() 的 显示 ) %b 二 进 制 整数 
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续 表 
格式 字符 说 明 格式 字符 说 明 
%d 十 进 制 整数 AE 指数 (基底 写 为 E) 
Hi 十 进 制 整数 ASA. AF 浮 点 数 
%o 八进制 整数 %g 指数 (e) 或 浮 点 数 (根据 显示 长 度 ) 
Wx 十 六 进 制 整数 %G 指数 (E) 或 浮 点 数 (根据 显示 长 度 ) 
%e 指数 (基底 写 为 e) 996 字符 % 
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下 面 的 代码 简单 演示 了 字符 串 格式 化 的 用 法 : 


>>>x =1235 

>>> so ="%O" $x 

>>> so 

"2323" 

>>> sh -"$x" $x 

>>> sh 

"4d3" 

>>> se ="%e" $x 

>>> se 

"1.235000e 03" 

>>> chr (ord ("3")+1) 

"a" 

>>> "$s"%65 # 类 似 于 str() 

"gs" 

>>> "%s"%65333 

"65333" 

>>> '&d, %c'% (65, 65) # 使 用 元 组 对 字符 串 进行 格式 化 , 按 位 置 进行 对 应 
'65,A" 

>>> "Ad"&"555" # 试 图 将 字符 串 转换 为 整数 进行 输出 , 抛 出 异常 
Traceback (most recent call last): 


File "«pyshell£ 19» ", line 1, in «module» 


ngd"g"555" 
TypeError: &d format: a number is required, not str 

»»»int('555') # 可 以 使 用 int () 函 数 将 合法 的 数字 字符 串 转换 为 整数 
555 


>>> '$s'$[1,2,3] 

'[1, 2, 3]" 

>>> str ((1,2,3)) # 可 以 使 用 str() 函 数 将 任意 类 型 数据 转换 为 字符 串 
"(1, 2, 3)' 

>>> str ([1,2,3]) 

',2, 3]" 


除了 上 面 介绍 的 字符 串 格式 化 方法 ,目前 Python 社区 更 推荐 使 用 format() 方 法 进行 
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格式 化 ,该 方法 更 加 灵活 ,不 仅 可 以 使 用 位 置 进行 格式 化 ,还 支持 使 用 与 位 置 无 关 的 名 字 来 
进行 格式 化 ,并 且 支 持 序列 解 包 格式 化 字符 串 ,为 程序 员 提供 了 方便 。 例 如 


>>>print "The number {0:,} in hex is: {0:#x}, the number {1} in oct is {1:#ojm.format (5555,55) 
The number 5,555 in hex is: 0x15b3, the number 55 in oct is 0067 
»»»print "The number (1:,) in hex is: {1:#x}, the number (0) in oct is (0:4 0)". format (5555,55) 
The number 55 in hex is: 0x37, the number 5555 in oct is 0012663 
»»» print "my name is {name}, my age is {age}, and my QQ is {qq}".format (name = 
"Dong Fuguo", age =37, qq = "306467355") 
my name is Dong Fuguo, my age is 37, and my QQ is 306467355 
»»»position = (5,8,13) 
>>>print "X:(0[0]);Y: (0[1] };Z:{0[2] }". format (position) 
X:5;Y:8;2:13 
»»» weather = [("Monday","rain"), ("Tuesday","sunny"), ("Wednesday", "sunny"), 
("Thursday","rain"), ("Friday","Cloudy")] 
>>> formatter = "Weather of '{0[0]}' is '{0[1]}'". format 
>>> for item in map (formatter, weather) : 
print item 
Weather of 'Monday' is 'rain" 
Weather of 'Tuesday' is 'sunny' 
Weather of 'Wednesday' is 'sunny' 
Weather of 'Thursday' is 'rain' 
Weather of 'Friday' is 'Cloudy" 


4.1.2. 字符 串 常用 方法 


字符 串 是 非常 重要 的 数据 类 型 ,Python 提供 了 大 量 的 函数 支持 字符 串 操 作 ,本 节 通 过 
几 个 示例 来 演示 部 分 函数 的 用 法 ,可 以 使 用 dir("") 查 看 所 有 字符 串 操 作 函 数列 表 , 并 使 用 
PY EPA C help() 查 看 每 个 函数 的 帮助 。 除 了 本 节 介 绍 的 字符 串 处 理 函 数 ,部 分 Python 内 
置 函 数 也 支持 对 字符 串 的 操作 ,例如 用 来 计算 序列 长 度 的 len() 方 法 ,用 来 比较 序列 大 小 的 
cmp() 方 法 等 ,因为 字符 串 也 是 Python 序列 的 一 种 。 

1. find) 

该 函数 用 来 查找 一 个 字符 串 在 另 一 个 字符 串 指定 范围 (默认 是 整个 字符 串 ) 中 首次 出 现 
的 位 置 , 如 果 不 存在 则 返回 一 1。 


>>> s= "apple, peach, banana, peach, pear’ 
>>> s. find ("peach") 

6 

>>> s. find ("peach", 7) 

19 

>>> s.find ("peach", 7,20) 

-1 


2. split© 
该 函数 用 来 以 指定 字符 为 分 隔 符 , 将 字符 串 分 割 成 多 个 字符 串 ,并 返回 包含 分 割 结果 的 
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列表 。 


>>> s= "apple, peach, banana, pear" 
>>> li=s.split (",") 

>>>1li 

["apple", "peach", "banana", "pear"] 
»»»s ="2014- 10-31" 
»»»t-s.split("-") 

»»»print t 

['2014', '10', '31'] 

»»»print map(int, t) 

[2014, 10, 31] 


如 果 不 指 定 分 隔 符 , 则 字符 串 中 的 任何 空白 符号 (包括 空格 .换行 符 和 制 表 符 等 ) 都 将 被 
认为 是 分 隔 符 ,返回 包含 最 终 分 割 结果 的 列表 。 


>>>s = hello world \n\n My name is Dong ' 
»»»s.split() 

['hello', 'world', 'My', 'name', 'is', 'Dong'] 

>>>s ='\n\nhello world \n\n\n My name is Dong ' 
»»»s.split() 

['hello', 'world', 'My', 'name', 'is', 'Dong'] 

>>>s ='\n\nhello\t\t world \n\n\n My name\t is Dong ' 
>>>s.split() 


['hello', 'world', 'My', 'name', 'is', 'Dong'] 
该 方法 还 允许 指定 最 大 分 割 次 数 ,例如 : 


>>>s ='\n\nhello\t\t world \n\n\n My name is Dong ' 
>>> s.split (None, 1) 

['hello', 'world \n\n\n My name is Dong '] 

>>> s.split (None, 2) 

['hello', 'world', 'My name is Dong '] 

>>> s.split (None, 5) 

['hello', 'world', 'My', 'name', 'is', 'Dong '] 
»»»s.split (None, 6) 

['hello', 'world', 'My', 'name', 'is', 'Dong'] 


3. join() 
与 split() 方 法 相反 ,该 函数 用 来 将 列表 中 多 个 字符 串 进 行 连接 ,并 在 相 邻 两 个 字符 串 
之 间 插 入 指定 字符 。 


>>> li= ["apple", "peach", "banana", "pear"] 
>>>sep="," 

>>> s=sep. join (li) 

>>>s 


"apple,peach, banana, pear" 
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使 用 运算 符 十 也 可 以 连接 字符 串 ,但 效率 较 低 , 应 优先 使 用 join() 方 法 。 下 面 的 代码 演 
示 了 两 者 之 间 速 度 的 差异 : 


import timeit 
strlist- ['This is a long string that will not keep in memory.' for n in xrange (100) ] 
def use join() : 

return ''.join(strlist) 
def use plus): 

result='' 

for strtemp in strlist: 

result- result+ strtemp 

return result 
if name --' main ': 

times- 1000 

jointimer -timeit.Timer('use join()','from main import use join') 

print 'time for join:',jointimer.timeit (number- times) 

plustimer =timeit.Timer('use_plus()','from main import use plus') 


print 'time for plus:',plustimer.timeit (number- times) 
该 代码 分 别 使 用 join() 函 数 和 十 对 100 个 字符 串 进行 连接 ,并 重复 运行 1000 次 ,然后 
输出 每 种 方法 所 使 用 的 时 间 ,运行 结果 为 


time for join: 0.00395874865103 
time for plus: 0.0260573301694 


4. lowerO ,upperO ,capitalizeO title ) Xl swapease() 
这 几 个 函数 分 别 用 来 将 字符 串 转 换 为 小 写字 符 串 ,将 字符 串 转换 为 大 写字 符 串 ,将 字符 
串 首 字母 变 为 大 写 ,将 每 个 单词 的 首 字母 变 为 大 写 以 及 大 小 写 互 换 。 


>>> s= "What is Your Name?" 
>>> s2=s.lower() 

>>> s2 

"what is your name?" 
>>> s.upper () 

"WHAT IS YOUR NAME?" 
»»»s2.capitalize() 
"What is your name?" 
>>>s.title() 

"What Is Your Name?" 
»»»s.swapcase() 
"wHAT IS yOUR nAME?" 


5. replace() 
该 函数 用 来 替换 字符 串 中 指定 字符 或 子 字符 串 的 所 有 重复 出 现 ,每 次 只 能 蔡 换 一 个 字 
符 或 一 个 子 字符 串 的 重复 出 现 。 
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>>>s= "中 国 , 中 国 " 

>>>print s 

中 国 , 中 国 

>>> s2=s.replace("P HI", "中 华人 民 共 和 国 ") 
>>>print s2 


中 华人 民 共和 国 ,中华 人民 共和 国 


6. maketrans() 和 translate) 


maketrans() 函 数 用 来 生成 字符 映射 表 , 而 translate() 则 按 映射 表 关系 转换 字符 串 并 蔡 


换 其 中 的 字符 ,使 用 这 两 个 函数 的 组 合 可 以 同时 处 理 多 个 不 同 的 字符 ,replace() 则 无 法 满足 


这 一 


要 求 。 下 面 的 代码 演示 了 这 两 个 函数 的 用 法 ,当然 您 还 可 以 定义 自己 的 字符 映射 表 , 然 


后 用 来 对 字符 串 进行 加 密 。 
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>>> import string 

# 将 字符 "abcdef123" 一 一 对 应 地 转换 为 "uvwxyz@# $" 

>>> table= string.maketrans ("abcdef123", "uvwxyz@# $ ") 

>>> s= "Python is a greate programming language. I like it!" 
>>> s.translate (table) 

"Python is u gryuty progrumming lunguugy. I liky it!" 
>>>s.translate (table, "gtm") # 第 二 个 参数 表示 要 删除 的 字符 


"Pyhon is u ryuy proruin lunuuy. I liky i!" 


7. strip fl rstripO 
该 函数 用 来 删除 两 端 (或 右 端 ) 的 空白 字符 或 连续 的 指定 字符 。 


>>>s=" abc" 

>>> s2=s.strip() 

>>>s2 

"abc" 

>>> "aaaassddf".strip ("a") 
"ssddf" 

>>> "aaaassddf".strip ("af") 
"ssdd" 

>>> "aaaassddfaaa".rstrip ("a") 


'aaaassddf' 


8. eval() 
内 置 函 数 eval() 尝 试 把 任意 字符 串 转 化 为 Python 表达 式 并 进行 求 值 。 


>>>eval ("3+ 4") 
4 

>>>a =3 
>>>b=5 
»»»eval('atb') 
8 

»»» import math 
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>>>eval ("help (math.sqrt) ') 
Help on built- in function sqrt in module math: 
sqrt (++) 
sqrt (x) 
Return the square root of x. 
>>> eval ('math. sqrt (3) ') 
1.7320508075688772 
>>> eval ("aa") 
Traceback (most recent call last): 
File "<pyshell#3>", line 1, in «module» 
eval ('aa') 
File "<string>", line 1, in «module» 


NameError: name 'aa' is not defined 

使 用 eval() 时 要 注意 的 一 个 问题 是 , 它 可 以 计算 任意 合法 表达 式 的 值 , 如 果 用 户 巧 妙 地 
构造 输入 ,可 以 执行 任意 外 部 程序 ,例如 下 面 的 代码 运行 后 可 以 启动 记事 本 程序 : 

>>>a =input ("Please input a value:") 

Please input a value:"__ import__('os') .startfile(r'C:\windows\\notepad.exe')" 

>>> eval (a) 

是 不 是 非常 危险 啊 ? 如 果 您 觉得 这 没什么 的 话 ,再 执行 下 面 的 代码 试 试 ,然后 看 看 当前 


工作 目录 中 多 了 什么 ,当然 您 可 以 调用 命令 来 删除 这 个 文件 夹 或 其 他 文件 。 


»»»eval(" import ('os').system('md testtest')") 


9. 关键 字 in 

与 列表 、 元 组 .字典 、 集 合 一 样 , 也 可 以 使 用 关键 字 in 和 not in 来 判断 一 个 字符 串 是 否 
出 现在 另 一 个 字符 串 中 。 

>>> "a" in "abcde" 

True 

>>> "ab' in 'abcde' 

True 

>>>"j" in "abcde" 

False 

10. startswith() 1 endswith() 

这 两 个 函数 用 来 判断 字符 串 是 否 以 指定 字符 串 开始 或 结束 。 在 2. 1. 8 节 中 介绍 列表 推 
导 式 时 用 到 过 ,请 自行 翻阅 。 

11. isalnum() ,isalpha() 和 isdigit() 

用 来 测试 字符 串 是 否 为 数字 或 字母 .是 否 为 字母 ,是否 为 数字 字符 。 


>>> "1234abcd' .isalnum() 
True 
>>> '1234abcd" .isalpha() 


False 
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>>> '1234abcd' .isdigit() 
False 

>>> 'abcd' .isalpha () 
True 

>>> '1234.0' .isdigit() 
False 

>>> 11234" .isdigit() 


True 


4.1.3. 字符 串 常量 


在 string 模块 中 定义 了 多 个 字符 串 常量 ,包括 数字 字符 、 标 点 符号 .英文 字母 ,大 写字 母 
和 小 写字 符 等 ,用 户 可 以 直接 使 用 这 些 常量 。 


>>> import string #Python 2.7.8 

>>> string.digits 

"0123456789" 

>>> string.punctuation 

TIMES EEN 09 +,- ./:;«722?80[N]^ "(D " 
»»»string.letters 

'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghi j k1mnopqrstuvwxyz "' 
»»»string.printable 
'0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPORSTUWWXYZ 4 $ $&V ' () * +,-./17<=>? 
G[NN]^ "(129 \t\n\r\xO0b\x0c' 

»»»string.lowercase 

'abcdefghi jklmnopqrstuvwxyz ' 

>>> string.uppercase 

' ABCDEFGHIJKLMNOPQRSTUVWXYZ ' 


4.2. 正则 表达 式 


正则 表达 式 是 字符 串 处 理 的 有 力 工具 和 技术 ,正则 表达 式 使 用 预定 义 的 特定 模式 去 匹 
配 一 类 具有 共同 特征 的 字符 串 ,主要 用 于 处 理 字符 串 ,可 以 快速 .准确 地 完成 复杂 的 查找 、 蔡 

Python 中 ,re 模块 提供 了 正则 表达 式 操作 所 需要 的 功能 。 本 节 中 首先 介绍 正则 表达 式 
的 基础 知识 ,然后 介绍 re 模块 提供 的 正则 表达 式 函 数 与 对 象 的 用 法 。 


4.2.1 正则 表达 式 元 字符 


正则 表达 式 由 元 字符 及 其 不 同 组 合 来 构成 ,通过 巧妙 地 构造 正则 表达 式 可 以 匹配 任意 
类 型 字符 串 。 常 用 的 正则 表达 式 元 字符 如 表 4-2 所 示 。 
R42 正则 表达 式 常用 元 字符 
元 字符 功能 说 明 
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元 字符 功能 说 明 
匹配 除 换行 符 以 外 的 任意 单个 字符 
* 匹配 位 于 * 之 前 的 0 个 或 多 个 字符 
十 匹配 位 于 十 之 前 的 一 个 或 多 个 字符 
| 匹配 位 于 | 之 前 或 之 后 的 字符 
匹配 行 首 ,匹配 以 ^ 后 面 的 字符 开头 的 字符 串 
$ 匹配 行 尾 ,匹配 以 $ 之 前 的 字符 结束 的 字符 串 
? 匹配 位 于 “?” 之 前 的 0 个 或 1 个 字符 
\ 表示 位 于 \ 之 后 的 为 转 义 字符 
g 匹配 位 于 口中 的 任意 一 个 字符 
= 用 在 口 之 内 用 来 表示 范围 
O 将 位 于 () 内 的 内 容 作为 一 个 整体 来 对 待 
0 按 {} 中 的 次 数 进行 匹配 
\b 匹配 单词 头 或 单词 尾 
AB 与 \b 含义 相反 
M 匹配 任何 数字 ,相当 于 [0 一 9] 
\D 与 \d 含义 相反 
\s 匹配 任何 空白 字符 
\s 与 \s 含义 相反 
Ww 匹配 任何 字母 ,数字 以 及 下 划 线 ,相当 于 [a 一 z A 一 Z 0 一 9_] 
\w 与 \w 含义 相反 


如 果 以 \ 开 头 的 元 字符 与 转 义 字符 相同 , 则 需要 使 用 \\ ,或 者 使 用 原始 字符 串 , 即 在 字符 
串 前 加 上 字符 r。 

有 具体 应 用 时 ,可 以 单独 使 用 某 种 类 型 的 元 字符 ,但 处 理 复杂 字符 串 时 ,经 常 需要 将 多 个 
正则 表达 式 元 字符 进行 组 合 , 下 面 给 出 了 几 个 简单 的 示例 。 

(1) 最 简单 的 正则 表达 式 是 普通 字符 串 , 可 以 匹配 自身 。 

(2) 人 pic]ython' 可 以 匹配 ' python'、jython'、cython'。 

G) (fa 一 zA 一 Z0 一 9 可 以 匹配 一 个 任意 大 小 写字 母 或 数字 。 

(4) 人 ^abcj 可 以 匹配 任意 一 个 除 a'、b'、c 之 外 的 字符 。 

(5) "python perl'2&'p(ython| erl) 都 可 以 匹配 python' 或 perl'。 

(6) 子 模式 后 面 加 上 问号 表示 可 选 。r(Chttp://)? (wwwN. )? python\. org' 只 能 匹配 ' 
http://www. python. org','http://python. org','www. python. org"fll'python. org’. 

(7) ^http' 只 能 匹配 所 有 以 'http' 开 头 的 字符 串 。 

(8) (pattern) * : 允许 模式 重复 0 次 或 多 次 。 

(9) (pattern) +: 允许 模式 重复 1 次 或 多 次 。 
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(10) (pattern) {m,n): 允许 模式 重复 m~n K. 

在 具体 构造 正则 表达 式 时 ,要 注意 可 能 会 发 生 的 错误 ,尤其 是 涉及 特殊 字符 时 。 例 如 ， 
下 面 这 段 代 码 在 第 1 章 中 已 经 出 现 过 ,作用 是 用 来 匹配 Python 程序 中 的 运算 符 , 但 是 有 些 
运算 符 与 正则 表达 式 的 元 字符 相同 ,如 果 处 理 不 当 则 会 造成 错误 : 


>>> import re 
wn EO We pe 
>>> for i in symbols: 
patter =re.compile(r'\s* 'titr'\s* ') 
Traceback (most recent call last): 
File "<pyshell#11>", line 2, in «module» 
patter =re.compile(r'\s* 'titr'\s* ') 
File "C:\python27\lib\re.py", line 190, in compile 
return compile (pattern, flags) 
File "C:\python27\lib\re.py", line 244, in compile 
raise error, v # invalid expression 
error: multiple repeat 
>>> for i in symbols: 
patter =re.compile(r'\s* 'tre.escape(i)+r'\s* ') 


正常 执行 


4.2.2 re 模块 主要 方法 


在 Python 中 ,主要 使 用 re 模块 来 实现 正则 表达 式 的 操作 。 该 模块 的 常用 方法 如 表 4-3 
所 示 ,具体 使 用 时 , 既 可 以 直接 使 用 re 模块 的 方法 进行 字符 串 处 理 ,也 可 以 将 模式 编译 为 正 
则 表达 式 对 象 , 然 后 使 用 正则 表达 式 对 象 的 方法 来 操作 字符 串 。 
表 4-3 re 模块 常用 方法 


p- d* 功能 说 明 
compile(pattern[ ,flags]) 创建 模式 对 象 
search( pattern, string[ ,flags]) 在 整个 字符 串 中 寻找 模式 ,返回 match 对 象 或 None 
match( pattern, string[ ,flags]) 从 字符 串 的 开始 处 匹配 模式 ,返回 match 对 象 或 None 
findall(pattern,string[ ,flags]) 列 出 字符 串 中 模式 的 所 有 匹配 项 
split(pattern, string[ ,maxsplit 一 0]) 根据 模式 匹配 项 分 割 字符 串 
sub( pat, repl, string[ ,count=0]) 将 字符 串 中 所 有 pat 的 匹配 项 用 repl 替换 
escape(string) 将 字符 串 中 所 有 特殊 正则 表达 式 字 符 转 义 


其 中 函数 参数 flags 的 值 可 以 是 re. I( 忽 略 大 小 写 ) re. Lire. M( 多 行 匹 配 模 式 ) re. S 
(使 元 字符 “. ”匹配 任意 字符 ,包括 换行 符 ) re. U( 匹 配 Unicode 字符 ) , re. X( 忽 略 模式 中 的 
空格 ,并 可 以 使 用 # 注释) 的 不 同 组 合 (使 用 | 进行 组 合 ) 。 


4.2.3 直接 使 用 re 模块 的 方法 
可 以 直接 使 用 re 模块 的 方法 来 实现 正则 表达 式 操作 ,本 节 通 过 几 个 具体 的 示例 来 简单 
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演示 其 用 法 。 


>>> import re 

>>> text = 'alpha. beta: gamma delta' 
»»»re.split('[NV. ]* ', text) 

['alpha', 'beta', 'gamma', 'delta'] 

»»»re.split('[V. ]+',text,maxsplit=2) # 分 割 2 次 
['alpha', 'beta', 'gamma delta'] 

>>> re.split('[\. ]* ', text, maxsplit- 1) # 分 割 1 次 
['"alpha'，"beta…gamma delta'] 

>>>pat -'[a-zA-Z]* "' 

>>> re.findall (pat, text) # 查 找 所 有 单词 
['alpha', 'beta', 'gamma', 'delta'] 

>>>pat -'(name]' 

>>> text = 'Dear {name}. ' 


>>> re.sub (pat, 'Mr .Dong', text) fT ER 
"Dear Mr.Dong… " 

>>>s='asd' 

>>> re.sub('a|s|d', 'good',s) # 字 符 串 替换 
"good good good" 


>>> re.escape ("http://www.python.org') # 字 符 串 转 义 
"http\\:\\/\\/www\\ .python\\.org" 

>>>print re.match ('done|quit', 'done') # 匹配 成 功 
€ sre.SRE Match object at 0x00B121A8» 

»»»print re.match('done|quit', 'done! ') # 匹 配 成 功 

€ sre.SRE Match object at 0x00B121R8> 

»»»print re.match('done|quit', 'doe! ') # 匹 配 不 成 功 
None 

>>>print re.match('done|quit','d!one!') #DUACA MI) 
None 


下 面 的 代码 使 用 不 同 的 方法 删除 字符 串 中 多 余 的 空格 ,如 果 遇 到 连续 多 个 空格 则 只 保 
留 一 个 。 


>>> import re 

>>>s = "aaa bb cde fff' 

>>> re.sub("\s+', ' ',s) # 直 接 使 用 re 模块 的 字符 串 蔡 换 方法 
"aaa bb cde fff ' 

>>>re.split('[\s]+', s) 

[*àaa*, 'hb*, *c*, *d*, 'e', *frer*, "'] 
>>> re.split ("[\s]+',s-strip()) 

['aaa', 'bb', 'c', 'd', 'e', 'fff'] 

>>>' '.join(re.split ('[\s]+',s.strip())) 
"aaa bb cde fff" 

>>>' '.join(re.split ('As* ',s.strip())) 
"aaa bb cde fff" 
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>>> re.sub("\st'," ',s.strip()) 

‘aaa bb cde fff" 

>>>s.split () # 也 可 以 不 使 用 正则 表达 式 
['aaa', "bb', 'c', 'd', 'e', '£££'] 

>>>' '.join(s.split()) 

"aaa bb c de fff" 


下 面 的 代码 使 用 以 \ 开 头 的 元 字符 来 实现 字符 串 的 特定 搜索 。 


>>> import re 

»»»example = 'ShanDong Institute of Business and Technology' 

>>> re.findall('Wba.* ?\\b', example) * 以 a 开 头 的 完整 单词 

['and'] 

>>> re. findall ("\\Bo.+ ?\\b", example) # 不 以 OF KABA 字母 的 单词 剩余 部 分 
['ong', 'ology'] 

>>> re. findall ("\\b\w.+ ?\\b', example) # 所 有 单词 

['ShanDong', 'Institute', 'of', 'Business', 'and', 'Technology'] 

>>> re.findall (r'\b\w.+ ?\b', example) # 使 用 原始 字符 串 ,减少 需要 输入 的 符号 数量 
['ShanDong', 'Institute', 'of', 'Business', 'and', 'Technology'] 

>>> re. findall ("\d\.\d\.\d', "Python 2.7.8') # 查 找 并 返回 x.x.x 形 式 的 数字 

['2.7.8'] 

>>> re.split ('\s',example) # 使 用 任何 空白 字符 分 割 字符 串 


['ShanDong', 'Institute', 'of', 'Business', 'and', 'Technology'] 


4.2.4 ”使 用 正则 表达 式 对 象 


首先 使 用 re 模块 的 compile() 方 法 将 正则 表达 式 编译 生成 正则 表达 式 对 象 ,然后 再 使 


用 正则 表达 式 对 象 提供 的 方法 进行 字符 串 处 理 , 使 用 编译 后 的 正则 表达 式 对 象 可 以 提高 字 
符 串 处 理 速度 。 


正则 表达 式 对 象 的 match(string[ ,pos[ ,endpos]]) 方 法 用 于 在 字符 串 开 头 或 指定 位 置 


进行 搜索 ,模式 必须 出 现在 字符 串 开 头 或 指定 位 置 ;search(string[,pos[L,endpos]]) 方 法 用 
于 在 字符 串 整个 指定 范围 中 进行 搜索 ;findall(string[,pos[,endpos]]) 方 法 用 于 在 字符 串 
中 查找 所 有 符合 正则 表达 式 的 字符 串 并 以 列表 形式 返回 。 
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import re 

»»»example = 'ShanDong Institute of Business and Technology" 
»»»pattern —re.compile (r'\bB\wt \b') # 以 B 开 头 的 单词 
»»»pattern.findall (example) 

['Business'] 

»»»pattern =re.compile(r'\wtg\b') # 以 g 结 尾 的 单词 


»»»pattern.findall (example) 

['ShanDong'] 

>>>pattern =re.compile(r'\b[a-zA-Z]{3}\b') +#EÆR 3 个 字母 长 的 单词 
»»»pattern.findall (example) 

['and'] 

>>>pattern.match (example) # 从 字符 串 开 头 开始 匹配 ,不 成 功 , 没 有 返回 值 


»»»pattern.search (example) # 在 整个 字符 串 中 搜索 ,成 功 
« sre.SRE Match object at 0x01228EC8> 

>>>pattern =re.compile(r'\b\w* a\w* Vo') # 查 找 所 有 含有 字母 a 的 单词 
»»»pattern.findall (example) 

['ShanDong', 'and'] 


正则 表达 式 对 象 的 sub(repl,string[ .count—0 ]) RI subn(repl.string[ .count—0 D Jri& 
用 来 实现 字符 串 蔡 换 功能 。 


»»»example ='''Beautiful is better than ugly. 
Explicit is better than implicit. 

Simple is better than complex. 

Complex is better than complicated. 

Flat is better than nested. 

Sparse is better than dense. 

Readability counts.''" 

pattern =re.compile(r'\bb\w* WVo',re.I) 
>>>print pattern.sub(' * ',example) # 将 以 字母 b 和 B 开 头 的 单词 替换 为 * 
* is * than ugly. 

Explicit is * than implicit. 

Simple is * than complex. 

Complex is * than complicated. 

Flat is * than nested. 

Sparse is * than dense. 

Readability counts. 

»»»print pattern.sub(' * ',example, 1) # 只 替换 一 次 
* is better than ugly. 

Explicit is better than implicit. 

Simple is better than complex. 

Complex is better than complicated. 

Flat is better than nested. 

Sparse is better than dense. 

Readability counts. 

»»»pattern =re.compile(r'\bb\w* Vb') 
»»»print pattern.sub(' * ',example,1) # 将 第 一 个 以 字母 b 开 头 的 单词 替换 为 * 
Beautiful is * than ugly. 

Explicit is better than implicit. 

Simple is better than complex. 

Complex is better than complicated. 

Flat is better than nested. 

Sparse is better than dense. 

Readability counts. 


正则 表达 式 对 象 的 split(string[ ,maxsplit 二 0]) 方 法 用 来 实现 字符 串 分 割 。 


>>> example =r'one, two, three. four/file\six?seven[eight]nine|ten' 
>>>pattern =re.compile(r'"[,-/\\?[\]\I]") 
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»»»pattern.split (example) 
['one', 'two', 'three', 'four', 'file', 'six', 'seven', 'eight', 'nine', 'ten'] 
>>> example —r'oneltwo?three3four4file5six6seven7eight8nine9ten' 

>>> pattern =re.compile(r'\d+') 

>>> pattern. split (example) 

['one', 'two', 'three', 'four', 'file', 'six', 'seven', 'eight', 'nine', 'ten'] 
»»»example —r'one two three four, file.six.seven,eight,nine9ten' 
»»»pattern =re.compile(r'[\s,.\d]+') 

»»»pattern.split (example) 


['one', 'two', 'three', 'four', 'file', 'six', 'seven', 'eight', 'nine', 'ten'] 


4.2.5 FRS match TK 


使 用 圆 括号 ”() ”表示 一 个 子 模式 , 圆 括号 内 的 内 容 作为 一 个 整体 出 现 ,例如 (red) 十 可 


以 匹配 redred redredred 等 多 个 重复 red 的 情况 。 


>>> telNumber = '''Suppose my Phone No. is 0535- 1234567, 

yours is 010- 12345678, his is 025- 87654321.''' 

»»» pattern -re.compile (r' (\d{3,4})- (\d{7,8}) ") 
»»»pattern.findall (telNumber) 

[('0535', '1234567'), ('010', '12345678'), ('025', '87654321')] 


正则 表达 式 对 象 的 match() 方 法 和 search() 方 法 匹配 成 功 后 返回 match XJ $2. match 


对 象 的 主要 方法 有 group() .groups( .groupdict() ,start() .end() 和 span() 等 。 
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import re 
telNumber = ' ' ' Suppose my Phone No. is 0535- 1234567, yours is 010- 12345678, his is 025- 
87654321.''' 
pattern -re.compile (r' (\d{3,4})- (\d{7,8}) ") 
index -0 
while True: 
matchResult =pattern.search (telNumber, index) 
if not matchResult: 
break 
print '-'* 30 
print 'Success:' 
for i in range(3): 
print 'Searched content:', matchResult.group(i),\ 
' Start from:',matchResult.start (i), "End at:',matchResult.end(i),\ 
' Its span is:', matchResult.span (i) 
index =matchResult.end (2) 


上 面 程序 的 运行 结果 如 下 : 


Success: 


Searched content: 0535- 1234567 Start from: 24 End at: 36 Its span is: (24, 36) 


Searched content: 0535 Start from: 24 End at: 28 Its span is: (24, 28) 
Searched content: 1234567 Start from: 29 End at: 36 Its span is: (29, 36) 
Success: 

Searched content: 010- 12345678 Start from: 47 End at: 59 Its span is: (47, 59) 
Searched content: 010 Start from: 47 End at: 50 Its span is: (47, 50) 

Searched content: 12345678 Start from: 51 End at: 59 Its span is: (51, 59) 
Success: 

Searched content: 025- 87654321 Start from: 68 End at: 80 Its span is: (68, 80) 
Searched content: 025 Start from: 68 End at: 71 Its span is: (68, 71) 

Searched content: 87654321 Start from: 72 End at: 80 Its span is: (72, 80) 


使 用 子 模式 扩展 语法 可 以 实现 更 加 复杂 的 字符 串 处 理 ,常用 的 子 模式 扩展 语法 如 表 4-4 
所 示 。 
表 4-4 子 模式 扩展 语法 


语 法 功能 说 明 

(7P<groupname>) | 为 子 模式 命名 

(?iLmsux) 设置 匹配 标志 ,可 以 是 几 个 字母 的 组 合 ,每 个 字母 含义 与 编译 标志 相同 

(Q7) 匹配 但 不 捕获 该 匹配 的 子 表达 式 

(?P=groupname) 表示 在 此 之 前 的 命名 为 groupname 的 子 模式 

(CE) 表示 注释 

(Qe) 用 于 正则 表达 式 之 后 ,表示 如 果 三 后 的 内 容 在 字符 串 中 出 现 则 匹配 ,但 不 返回 二 
之 后 的 内 容 

ios 用 于 正则 表达 式 之 后 ,表示 如 果 ! 后 的 内 容 在 字符 串 中 不 出 现 则 匹配 ,但 不 返 
d 回 ! 之 后 的 内 容 

(<=) 用 于 正则 表达 式 之 前 ,与 (?=…) 含 义 相同 

Gr) 用 于 正则 表达 式 之 前 ,与 (?!…) 含 义 相同 


下 面 通过 几 个 示例 来 演示 子 模式 扩展 语法 的 应 用 。 


>>> import re 

»»»exampleString ='''There should be one— and preferably only one— obvious way to do it. 
Although that way may not be obvious at first unless you're Dutch. 

Now is better than never. 

Although never is often better than right now.''' 

»»»pattern -re.campile (r' (2«- WAs)never(2- SW) ') # 查 找 不 在 句子 开头 和 结尾 的 单词 
>>>matchResult =pattern.search (exampleString) 

>>>matchResult.span () 

(172, 177) 

»»»pattern =re.compile (r' (?<=\w\s) never") # 查 找 位 于 句子 未 尾 的 单词 
>>>matchResult =pattern.search (exampleString) 

>>>matchResult.span () 
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(156，161) 
>>>pattern -re.compile(r' (?:is\s)better(\sthan)') — # 查 找 前 面 是 is 的 better than 组 合 
>>>matchResult =pattern.search (exampleString) 
>>>matchResult.span () 
(141, 155) 
>>>matchResult .group (0) #0 表示 整个 模式 
'is better than' 
»»»matchResult.group(1) 
' than" 
>>> pattern =re.compile (r"\b(?i)n\wt \b") FER n sk N SERES B8 BUR Bid 
>>> index =0 
>>>while True: 

matchResult =pattern.search (exampleString, index) 

if not matchResult: 

break 

print matchResult.group(0), ':', matchResult.span (0) 

index =matchResult.end(0) 
not : (92, 95) 
Now : (137, 140) 
never : (156, 161) 
never : (172, 177) 
now : (205, 208) 
>>> pattern =re.compile(r' (?< !not\s)be\b') # 查 找 前 面 没有 单词 not 的 单词 be 
>>> index =0 
>>>while True: 

matchResult =pattern. search (exampleString, index) 

if not matchResult: 

break 
print matchResult.group (0), ':', matchResult.span (0) 
index =matchResult.end (0) 


be : (13, 15) 

>>> exampleString[13:20] # 验 证 一 下 结果 是 否 正确 

"be one- ' 

>>>pattern =re.compile (r' (\b\w%* (?P« f> \wt) (?P=f)\w%* V) ") # 查 找 具 有 连续 相同 字母 的 单词 


>>> index =0 
>>>while True: 
matchResult =pattern.search (exampleString, index) 
if not matchResult: 
break 
print matchResult.group (0), ':',matchResult.group (2) 
index =matchResult.end(0) +1 
unless: s 
better: t 
better: t 


>>>s 
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'aabc abcd abbed abccd abcdd' 

>>>p -re.compile (r'(NbW* (?P<f> Ww ) (22=£) \w* Vo) ') 
»»»p.findall(s) 

[('aabc', 'a'), ('abbcd', 'b'), ('abccd', 'c'), ('abcdd', 'd')] 


4.2.6 正则 表达 式 综合 运用 


在 本 章 的 最 后 ,我 们 通过 一 个 在 实际 开发 中 非常 有 用 的 案例 来 演示 字符 串 处 理 以 及 正 
则 表达 式 的 使 用 。 在 本 例 中 ,除了 前 面 章节 中 介绍 的 列表 .字典 等 知识 ,还 用 到 了 后 面 的 知 
识 ,例如 文件 操作 ,请 自行 查阅 。 将 本 案例 代码 存 为 文件 FindIdentifiersFromPyFile. py, 运 
行 时 按照 提示 输入 要 检测 的 Python 源 程序 文件 ,该 程序 会 自动 提取 出 Python 源 文件 中 所 
有 的 类 名 、 函 数 名 以 及 各 种 变量 名 。 当 然 ,您 可 以 很 容易 地 修改 本 程序 以 实现 您 需要 的 更 为 
A IO Mb 5 IE SR. 


import re 
import os 


classes = {} 
functions = [] 


variables ={'normal':{}, 'parameter':(), 'infor':í(]]) 


def identifyClassNames (index, line): 
"parameter index is the line number of line, 
parameter line is a line of code of the file to check" 
pattern -re.compile (r' (?<=class\s) W* (?- . * ?:)') 
matchResult —-pattern.search (line) 
if not matchResult: 
return 
className —matchResult.group (0) 
classes[className] =classes.get (className, []) 


classes [className] .append (index) 


def identifyFunctionNames (index, line): 
pattern -re.compile (r' (?<=def\s) (W* )N((. * ?)\) (2=:)") 
matchResult —pattern.search (line) 
if not matchResult: 
return 
functionName —matchResult.group(1) 
functions.append((functionName, index)) 
parameters —matchResult.group(2).split(r', ') 
if parameters[0] =='': 
return 
for v in parameters: 
variables ['parameter'][v] —variables['parameter'].get(v, []) 
variables ['parameter'][v] -append (index) 
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def identifyVariableNames (index, line): 
# find normal variables, including the case: a, b =3, 5 
pattern =re.compile(r'\b(. * 2) (2=\s=)") 
matchResult =pattern. search (line) 
if matchResult: 
vs =matchResult.group(1).split(r', ') 
for v in vs: 
# consider the case 'if variable ==value' 
af "1E * Sn ve 
v -v.split() [1] 
# consider the case: 'a[3] =3' 
if'['invs 
v 7v[0:v.index('[")] 
variables ['normal'][v] -variables['normal'].get(v, []) 


variables ['normal'][v].append (index) 


# find the variables in for statements 
pattern -re.compile (r' (?<=for\s) (. * ?) (?=\sin)') 
matchResult =pattern.search (line) 
if matchResult: 
vs =matchResult.group(1).split(r', ') 
for v in vs: 
variables ['infor'] [v] =variables['infor'].get(v, []) 


variables ['infor'][v].append (index) 


def output () : 
print '='* 30 
print 'The classes' names and their line numbers are:' 
for key, value in classes.items(): 


print key, ':', value 


print '='* 30 
print 'The functions' names and their line numbers are:" 
for i in functions: 


print i[0], ':', i[1] 


print '-'* 30 
print 'The normal variable names and their line numbers are:' 
for key, value in variables |['normal'].items(): 
print key, ':', value 
print '-'*20 
print 'The parameter names and their line numbers in functions are:' 


for key, value in variables |['parameter'].items(): 


print key, ':', value 
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print '-'*20 
print "The variable names and their line numbers in for statements are:' 
for key, value in variables ['infor'].items(): 


print key, ':', value 


# suppose the lines of comments less than 50 
def comments (index) : 
for i in range(50): 
line -allLines [index *i].strip() 
if line.endswith('"""') or line.endswith (" 


return itl 


. main ': 


if name — 


fileName = input ('Please input the file name (including the full path if neccesary 
if not os.path.isfile (fileName) : 
print 'Your input is not a file.' 
if not fileName.endswith('.py'): 
print 'Sorry. I can only check Python source file." 
allLines - [] 
with open (fileName, 'r') as fp: 
allLines = fp.readlines () 


index =0 
totalLen = len (allLines) 
while index <totalLen: 
line -allLines [index] 
# strip the blank characters at both end of line 
line -line.strip() 
f ignore the comments starting with '#' 
if line.startswith('#'): 
index +=1 
continue 
# ignore the comments between ''' or """ 
if line.startswith('"""') or line.startswith("'''"): 
index *- comments (index) 
continue 
# identify identifiers 
 identifyClassNames (index*1, line) 
 identifyFunctionNames (index*1, line) 
_ identi fyVariableNames (index* 1, line) 
index +=1 
output () 


本 章 知识 精 要 


(1) Python 3.x 全 面 支持 中 文 ,Python 2. x 对 中 文 支持 还 不 够 ,需要 在 不 同 的 编码 格 
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式 之 间 进 行 必要 的 转换 。 

(2) 对 于 短 字 符 串 ,Python 支持 驻 留 机 制 。 

(3) 虽然 字符 串 属 于 不 可 变 序列 ,但 支持 使 用 replace() 方 法 以 及 maketrans() 和 
translate() 方 法 进行 蔡 换 操作 , 蔡 换 时 返回 新 字符 串 ,并 不 对 原 字 符 串 做 任何 修改 。 

(4) 对 用 户 输入 的 字符 串 进行 eval() 操 作 时 可 能 会 有 安全 漏洞 。 

(5) 可 以 直接 使 用 re 模块 的 方法 来 进行 字符 串 处 理 ,也 可 以 将 模式 编译 为 正则 表达 式 
对 象 ,然后 使 用 正则 表达 式 对 象 的 方法 来 操作 字符 串 。 


jg 


1. 假设 有 一 段 英 文 ,其 中 有 单独 的 字母 1 误 写 为 i, 请 编写 程序 进行 纠正 。 

2. 假设 有 一 段 英文 ,其 中 有 单词 中 间 的 字母 i 误 写 为 1, 请 编写 程序 进行 纠正 。 

3. 有 一 段 英文 文本 ,其 中 有 单词 连续 重复 了 2 次 ,编写 程序 检查 重复 的 单词 并 只 保留 
一 个 。 例 如 ,文本 内 容 为 “This is is a desk. ”, 程 序 输出 为 “This is a desk. ”. 

4. 简单 解释 Python 的 字符 串 驻 留 机 制 。 

5. 编写 程序 ,用 户 输 入 一 段 英文 ,然后 输出 这 段 英文 中 所 有 长 度 为 3 个 字母 的 单词 。 
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第 5 章 函数 设计 与 使 用 


在 实际 开发 中 ,有 很 多 操作 是 完全 相同 或 者 是 非常 相似 的 ,仅仅 是 处 理 的 数据 不 同 而 
已 ,因此 经 常会 在 不 同 的 代码 位 置 多 次 执行 相似 或 完全 相同 的 代码 块 。 从 软件 设计 和 代码 
复 用 的 角度 来 讲 , 很 显然 ,直接 将 该 代码 块 复制 到 多 个 相应 的 地 方 然后 进行 简单 修改 绝对 不 
是 一 个 好 主意 。 虽 然 这 样 可 以 使 得 多 份 复制 的 代码 可 以 彼此 独立 地 进行 修改 ,但 这 样 不 仅 
增加 了 代码 量 , 使 得 程序 文件 变 大 ,也 增加 了 代码 理解 和 代码 维护 的 难度 ,更 重要 的 是 为 代 
码 测试 和 纠 错 带 来 了 很 大 麻烦 。 一 旦 被 复制 的 代码 块 将 来 某 天 被 发 现存 在 问题 而 需要 修 
改 , 则 必须 将 所 有 的 复制 都 做 同样 正确 的 修改 ,这 在 实际 中 是 很 难 完成 的 一 项 任务 。 由 于 代 
码 量 的 大 幅度 增加 ,导致 代码 之 间 的 关系 更 加 复杂 ,很 可 能 在 修补 了 旧 漏 洞 的 同时 又 引入 了 
新 漏洞 。 

解决 上 述 问 题 的 一 个 常用 的 方式 是 设计 和 编写 函数 。 将 可 能 需要 反复 执行 的 代码 封装 
为 函数 ,并 在 需要 执行 该 段 代码 功能 的 地 方 进 行 调用 ,不 仅 可 以 实现 代码 的 复 用 ,更 重要 的 
是 可 以 保证 代码 的 一 致 性 ,只 需要 修改 该 函数 代码 则 所 有 调用 位 置 均 受到 影响 。 当 然 ,在 实 
际 开发 中 ,需要 对 函数 进行 良好 的 设计 和 优化 才能 充分 发 挥 其 优势 。 在 编写 函数 时 ,有 很 多 
原则 需要 参考 和 遵守 ,例如 ,不 要 在 同一 个 函数 中 执行 太 多 的 功能 ,尽量 只 让 其 完成 一 个 功 
能 ,以 提高 模块 的 内 聚 性 。 另 外 ,尽量 减少 不 同 函 数 之 间 的 隐 式 耦合 ,如 减少 全 局 变量 的 使 
用 ,使 得 函数 之 间 仅 通过 调用 和 参数 传递 来 显 式 体现 其 相互 关系 。 

在 编写 函数 时 ,函数 体 中 代码 的 编写 与 前 面 章 节 介绍 的 基本 一 致 ,只 是 对 代码 进行 了 封 
装 并 增加 了 函数 调用 传递 参 数 、 返 回 计算 结果 等 外 围 接口 ,这 也 正 是 本 章 讲 解 的 重点 。 


5.1 AEX 


在 Python 中 ,定义 函数 的 语法 如 下 : 使 用 def 关键 字 来 定义 函数 ,然后 是 一 个 空格 和 
函数 名 称 , 接 下 来 是 一 对 圆 括号 ,在 圆 括 号 内 是 形式 参数 列表 ,如 果 有 多 个 参数 则 使 用 逗号 
分 隔 开 , 圆 括 号 之 后 是 一 个 冒号 ,最 后 以 换行 开始 的 函数 体 代码 。 定 义 函 数 时 需要 注意 的 问 
题 是 : 函数 形 参 不 需要 声明 其 类 型 ; @@ 即 使 该 函数 不 需要 接受 任何 参数 ,也 必须 保留 一 
对 空 的 圆 括号 ; @ 函 数 体 相 对 于 def 关键 字 必 须 保 持 一 定 的 空格 缩 进 。 

det 函数 名 ([ 参 数列 表 ]) : 

函数 体 


例如 ,下 面 的 函数 用 来 计算 斐 波 那 契 数列 中 小 于 参数 n 的 所 有 值 : 


def fib(n): 
a, b=1,1 
while a «n: 


print(a, end-' ') 
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a, b-b, atb 
print () 


该 函数 的 调用 方式 为 


fib(1000) 
5.2 形 参 与 实 参 


函数 定义 时 圆 括 弧 内 是 使 用 逗号 分 隔 开 的 形 参 列表 ,一 个 函数 可 以 没有 形 参 ,但 是 定义 
时 一 对 圆 括 弧 必 须要 有 ,表示 该 函数 不 接受 参数 。 函 数 调用 时 向 其 传递 实 参 ,根据 不 同 的 参 
数 类 型 ,将 实 参 的 值 或 引用 传递 给 形 参 。 

例如 ,在 5. 1 节 中 定义 函数 fib 〇 时 ,n 就 是 该 函数 的 形 参 ,而 调用 该 函数 时 ,1000 则 是 
传递 给 该 函数 的 实 参 。 

在 定义 函数 时 ,对 参数 个 数 并 没有 限制 ,如 果 有 多 个 形 参 , 则 需要 使 用 逗号 进行 分 隔 。 
例如 ,下 面 的 函数 用 来 接受 2 个 参数 ,并 输出 其 中 的 最 大 值 。 


def printMax (a, b): 
if a>b: 
pirnt(a, 'is the max') 
else: 


print(b, 'is the max') 


当然 ,这 里 只 是 为 了 演示 ,而 忽略 了 一 些 细 节 , 如 果 输 入 的 参数 不 支持 比较 运算 , 则 会 出 
错 , 可 以 参考 后 面 第 8 章 中 介绍 的 异常 处 理 结构 来 解决 这 个 问题 。 
对 于 绝 大 多 数 情况 下 ,在 函数 内 部 直接 修改 形 参 的 值 不 会 影响 实 参 。 例 如 : 


>>> def addone (a) : 
print (a) 
at=1 
print (a) 

>>>a =3 

>>> addOne (a) 


>>>a 


从 运行 结果 可 以 看 出 ,在 函数 内 部 修改 了 形 参 a 的 值 ,但 是 当 函 数 结束 以 后 , 实 参 a 的 
值 并 没有 被 修改 ,可 以 参考 5.5 节 中 关于 变量 作用 域 的 讨论 。 当 然 ,在 有 些 情况 下 ,可 以 通 
过 特殊 的 方式 在 函数 内 部 修改 实 参 的 值 ,例如 : 


>>> def modify(v): 专修 改 列表 元 素 值 
v[0] =v[0]+1 

>>>a = [2] 

>>>modify (a) 
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>>>a 
[3] 
>>>def modify(v, item): # 为 列表 增加 元 素 
v.append (item) 
>>>a= [2] 
>>>modify (a, 3) 
>>>a 
(2, 3] 
>>> def modify (d) : # 修 改 字典 元 素 值 或 为 字典 增加 元 素 
d['age'] =38 
>>>a = ('name' :'Dong', 'age':37, 'sex':'Male'] 
>>>a 
{'age': 37, 'name': 'Dong', 'sex': 'Male'} 
>>>modify (a) 
>>>a 
{'age': 38, 'name': 'Dong', 'sex': 'Male'} 
也 就 是 说 ,如 果 传 递 给 函数 的 是 Python 可 变 序列 ,并 且 在 函数 内 部 使 用 下 标 或 其 他 方 
式 为 可 变 序列 增加 、 删 除 .修改 元 素 值 时 ,修改 后 的 结果 是 可 以 反映 到 函数 之 外 的 。 


5.3 参数 类 型 


在 Python 中 ,函数 参数 有 很 多 种 : 可 以 为 普通 参数 .默认 值 参数 .关键 参数 .可 变 长 度 
参数 等 。Python 函数 的 定义 也 非常 灵活 ,在 定义 函数 时 不 需要 指定 参数 的 类 型 , 形 参 的 类 
型 完全 由 调用 者 传递 的 参数 类 型 和 Python 解释 器 的 理解 和 推断 来 决定 ,类 似 于 某 些 语言 
中 的 泛 型 ;同样 ,也 不 需要 指定 孔 数 的 返回 值 类 型 ,这 将 由 函数 中 的 return 语句 来 决定 。 郴 
数 的 类 型 由 return 语句 返回 值 的 类 型 来 决定 ,如 果 函 数 中 没有 return 语句 或 者 没有 执行 到 
return 语句 而 返回 , 则 函数 默认 返回 空 值 None. 

由 于 Python 程序 是 解释 执行 的 ,因此 如 果 函 数 编写 或 设计 的 有 问题 ,只 有 在 调用 时 才 
可 能 被 发 现 , 传 递 某 些 类 型 的 参数 时 执行 正确 ,而 传递 男 一 些 类 型 的 参数 时 则 可 能 会 出 现 错 
误 。 出 现 这 样 的 情况 有 多 种 可 能 的 原因 .例如 ,不 同 的 参数 值 可 能 会 使 得 函数 执行 不 同 的 路 
和 经, 或 者 不 同 的 参数 类 型 所 支持 的 操作 和 运算 符 不 同 ,等 等 。 所 以 ,在 进行 测试 时 一 定 要 注 
意 ,一 次 或 几 次 运行 正常 并 不 表示 代码 编写 的 没有 问题 ,必须 要 进行 尽 可 能 完全 的 测试 , 尽 
量 满 足 各 种 覆盖 性 要 求 , 尽 量 在 代码 发 布 之 前 发 现 和 解决 更 多 的 潜在 问题 。 

5.3.1 默认 值 参数 

在 定义 函数 时 ,Python 支持 默认 值 参数 ,在 调用 这 样 的 函数 时 ,可 以 不 用 为 带 有 默认 值 
的 形 参 进行 传 值 ,此 时 函数 将 会 直接 使 用 函数 定义 时 设置 的 默认 值 。 语 法 如 下 : 

det 函数 名 (…, 形 参 名 = 默认 值 ) : 

函数 体 

调用 带 有 默认 值 参数 的 函数 时 ,可 以 不 对 默认 值 参数 进行 赋值 ,也 可 以 通过 显 式 赋 值 来 

替换 其 默认 值 ,具有 较 大 的 灵活 性 。 如 果 需 要 的 话 , 可 以 使 用 “函数 名 . func_defaults”( 在 
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Python 3. x 中 使 用 “函数 名 .defaults_) 随 时 查看 函数 所 有 默认 值 参 数 的 当前 值 ,返回 值 
为 一 个 元 组 ,其 中 的 元 素 依次 表示 每 个 默认 值 参数 的 当前 值 。 例 如 下 面 的 函数 定义 : 


>>>def say( message, times =1): 

print ((messaget' ') * times) [0:-1] 
>>> say. func defaults 
(1,) 


调用 该 函数 时 ,如 果 只 为 第 一 个 参数 传递 实 参 , 则 第 二 个 参数 使 用 默认 值 1; 如 果 为 第 
二 个 参数 传递 实 参 , 则 不 再 使 用 默认 值 1, 而 是 使 用 调用 者 显 式 传递 的 值 。 


>>> say ('hello') 
hello 

>>> say ('hello',3) 
hello hello hello 
>>> say ('hi',7) 

hi hi hi hi hi hi hi 


再 如 ,下 面 的 函数 使 用 指定 分 隔 符 将 列表 中 所 有 字符 串 元 素 连接 成 一 个 字符 串 。 


>>> def Join (List, sep= None): 
return (sep or ' ').join(List) 

»»»aList - ['a', 'b', 'c'] 

»»»Join(aList) 

'abc' 

»»»Join(aList, ',') 


'a,b,c' 


需要 注意 的 是 ,默认 值 参数 必须 出 现在 函数 参数 列表 的 最 右 端 , 且 任何 一 个 默认 值 参 数 
右边 都 不 能 再 出 现 非 默认 值 参数 。 例 如 下 面 的 示例 ,前 两 个 函数 不 符合 这 一 要 求 , 从 而 导致 
函数 定义 失败 ,如 图 5-1 所 示 。 


>>> def f(a-3,b,c-5): 
print a,b,c 


SyntaxError: non-default argument follows default argument 
>>> def f(a-3,b): 
print a,b 


SyntaxError: non-default argument follows default argument 


>>> def f(a,b,c-5): 
print a,b,c 


图 5-1 带 有 默认 值 参数 的 函数 定义 


另外 ,特别 需要 注意 的 是 ,默认 值 参数 只 被 解释 一 次 ,对 于 复杂 类 型 的 默认 值 参数 ,这 一 
点 可 能 会 导致 很 严重 的 逻辑 错误 ,而 这 种 错误 或 许 会 耗费 您 较 多 的 精力 来 定位 和 纠正 。 例 
如 下 面 的 代码 : 


def demo (newitem,old list- []): 
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old list.append (newitem) 
return old list 

print demo ('5', [1,2,3,4]) 

print demo ('aaa', ['a', 'b']) 

print demo ('a') 

print demo ('b') 


您 可 以 试 运行 一 下 上 面 的 代码 ,仔细 看 看 结果 ,是 否 能 发 现 问题 呢 ? 然后 再 把 代码 修改 


为 下 面 的 样子 ,再 试 运行 一 下 ,看 看 区 别 在 哪里 ? 然后 再 仔细 阅读 本 节 前 面 的 内 容 ,您 应 该 


def demo (newitem,old list-None): 

if old list is None: 
old list -[] 

old list.append (newitem) 
return old list 

print demo('5', [1,2,3,4]) 

print demo ('aaa', ['a', 'b']) 

print demo ('a') 


print demo ('b') 


5.3.2 关键 参数 


关键 参数 主要 指 实 参 , 即 调用 函数 时 的 参数 传递 方式 ,而 与 函数 定义 无 关 。 
通过 关键 参数 传递 , 实 参 顺序 可 以 和 形 参 顺序 不 一 致 ,但 不 影响 传递 结果 ,避免 了 用 户 


需要 牢记 参数 位 置 与 顺序 的 麻烦 ,使 得 函数 的 调用 和 参数 传递 更 加 灵活 方便 。 


>>> def demo (a,b,c=5): 
print a,b,c 

>>> demo (3,7) 

375 

>>> demo (a= 7, b= 3, c= 6) 
736 

>>> demo (c= 8, a= 9,b- 0) 
908 


5.3.3 可 变 长 度 参数 


可 变 长 度 参数 主要 有 两 种 形式 : * parameter 和 #*xparameter, 前 者 用 来 接受 任意 多 个 


实 参 并 将 其 放 在 一 个 元 组 中 ,后 者 接受 类 似 于 关键 参数 一 样 显 式 赋值 形式 的 多 个 实 参 并 将 


其 放 人 字典 中 。 
下 面 的 代码 演示 了 第 一 种 形式 的 用 法 ,无 论调 用 该 函数 时 传递 了 多 少 实 参 ,一 律 将 其 放 
>>> def demo (*p) : 
printp 
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>>> demo (1,2,3) 

(1, 2, 3) 

>>> demo (1,2,3,4,5, 6,7) 
(1, 2, 3, 4, 5, 6, 7) 


下 面 的 代码 则 演示 了 第 二 种 形式 的 用 法 ,在 调用 该 函数 时 自动 将 接受 的 参数 转换 为 
字典 


>>> def demo (**p) : 
for item in p.items(): 
print item 
>>> demo (x= 1, y= 2, z= 3) 
Cyr, 2) 
Cx', 1) 
Cz1, 3) 


下 面 的 代码 演示 了 几 种 不 同形 式 的 参数 混合 使 用 的 用 法 。 需 要 注意 的 是 ,虽然 Python 
完全 支持 您 这 样 做 ,但 是 除非 真 的 很 必要 ,否则 请 不 要 这 样 用 ,因为 这 会 使 得 代码 非常 混乱 
而 严重 降低 可 读 性 ,并 导致 程序 查 错 非常 困难 。 


>>> def func 4(a,b,c=4,*aa,**bb): 
Print (a,b,c) 
print aa 
print bb 
>>> func 4(1,2,3,4,5,6,7,8,9,xx- '1',yy- '2',zz-3) 
(1, 2, 3) 
(4, 5, 6, 7, 8, 9) 
[*yyts tat, Mre, See 3p 
>>> func_4(1,2,3,4,5,6,7,xx= '1', yy='2",zz= 3) 
(1, 2, 3) 
(4, 5, 6, 7) 
ayy 92°). "se *3*, Peels SF 


5.3.4 参数 传递 的 序列 解 包 


传递 参数 时 ,可 以 使 用 Python 列表 、 元 组 、 集 合 .字典 以 及 其 他 可 迁 代 对 象 作为 实 参 ， 
并 在 实 参 名 称 前 加 一 个 星 号 ,Python 解释 器 将 自动 进行 解 包 , 然 后 传递 给 多 个 单 变量 形 参 。 
但 需要 注意 的 是 ,如 果 使 用 字典 作为 实 参 , 则 默认 使 用 字典 的 键 ,如 果 需 要 将 字典 中 的 键 - 值 
对 作为 参数 则 需要 使 用 items() 方 法 ,如 果 需 要 将 字典 的 值 作为 参数 则 需要 调用 字典 的 
values() 方 法 。 最 后 ,请 保证 实 参 中 元 素 个 数 与 形 参 个 数 相等 ,否则 将 出 现 错误 。 


>>> def demo (a,b,c): 


print atbtc 
>>> seq = [1,2,3] 
>>> demo (* seq) 
6 
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>>>tup = (1,2,3) 

>>> demo (* tup) 

6 

>>>dic ={1:'a', 2:"b 3:'c') 
>>> demo (* dic) 

6 

>>> Set = {1,2,3} 

>>> demo (* Set) 

6 


5.4 return 语 句 


return 语句 用 来 从 一 个 函数 中 返回 , 即 结束 函数 的 执行 ,同时 还 可 用 return ifi 4] JA PR 
数 中 返回 一 个 任意 类 型 的 值 。 不 论 return 语句 出 现在 函数 的 什么 位 置 , 一 旦 得 到 执行 将 直 
接 结束 也 数 的 执行 。 如 果 函 数 没有 return 语句 或 者 执行 了 不 返回 任何 值 的 return ifi]. 
Python 将 认为 该 函数 以 return None 结束 , 即 返回 空 值 。 


def maximum( x, y ) : 
if xy: 
return x 
else: 


return y 


作为 使 用 者 ,在 调用 函数 时 ,一 定 要 注意 函数 有 没有 返回 值 ,是 否 会 对 参数 的 值 进 行 修 
改 。 例 如 ,前 面 介绍 过 的 列表 方法 sort() 属 于 原 地 操作 ,没有 返回 值 , 而 内 置 函 数 sorted() 
则 返回 排序 后 的 列表 ,并 不 对 原 列表 做 任何 修改 。 


>>>a_list = [1,2,3,4,9,5,7] 
>>> print (sorted (a_list)) 
[1, 2, 3, 4, 5, 7, 9] 
»»»print(a list) 

[1, 2, 3, 4, 9, 5, 7] 
»»»print(a list.sort()) 
None 

»»»print(a list) 

(1, 2, 3, 4, 5, 7, 9] 


5.5 变量 作用 域 


变量 起 作用 的 代码 范围 称 为 变量 的 作用 域 ,不同 作 用 域内 同名 变量 之 间 互 不 影响 。 一 
个 变量 在 函数 外 部 定义 和 在 函数 内 部 定义 ,其 作用 域 是 不 同 的 ,函数 内 部 定义 的 变量 一 般 为 
局 部 变量 ,而 不 属于 任何 函数 的 变量 一 般 为 全 局 变量 。 一 般 而 言 ,局 部 变量 的 引用 比 全 局 变 
量 速 度 快 ,应 优先 考虑 使 用 。 除 非 真 的 有 必要 ,应 尽量 避免 使 用 全 局 变量 ,因为 全 局 变量 会 
增加 不 同 函数 的 而 合 度 ,从 而 降低 代码 的 可 读 性 ,并 使 得 代码 测试 和 纠 错 变 得 很 困难 。 
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在 函数 内 定义 的 普通 变量 只 在 该 函数 内 起 作用 , 称 为 局 部 变量 。 当 函数 运行 结束 后 ,在 
该 函数 内 部 定义 的 局 部 变量 被 自动 删除 。 

如 果 想 要 在 函数 内 部 修改 一 个 定义 在 函数 外 的 变量 值 ,那么 这 个 变量 就 不 能 是 局 部 的 ， 
其 作用 域 必须 为 全 局 的 ,能 够 同时 作用 于 函数 内 外 , 称 为 全 局 变量 ,可 以 通过 global 来 声明 
或 定义 。 这 分 两 种 情况 。 

(1) 一 个 变量 已 在 函数 外 定义 ,如 果 在 函数 内 需要 修改 这 个 变量 的 值 ,并 要 将 这 个 赋值 
结果 反映 到 函数 外 ,可 以 在 函数 内 用 global 声明 这 个 变量 ,明确 声明 使 用 同名 的 全 局 变量 。 

(2) 在 函数 内 部 直接 将 一 个 变量 声明 为 全 局 变量 ,在 函数 外 没有 声明 ,在 调用 这 个 函数 
之 后 ,将 增加 为 新 的 全 局 变量 。 

通过 下 面 的 示例 代码 来 演示 局 部 变量 和 全 局 变量 的 用 法 。 


>>> def demo () : 
global x # 声 明 或 创建 全 局 变量 
x=3 # 修 改 全 局 变量 的 值 
y=4 # 局 部 变量 
print x,y 
>>>x=5 
>>> demo () # 本 次 调用 修改 了 全 局 变量 x 的 值 
34 
>>>x 
3 
»y # 局 部 变量 在 函数 运行 结束 之 后 自动 删除 
出 错 信息 
NameError: name 'y' is not defined 
>>>del x 
>>>x 
出 错 信息 
NameError: name 'x' is not defined 
>>> demo () # 本 次 调用 创建 了 全 局 变量 
34 


>>>x 


NameError: name 'y' is not defined 


5.6 lambda 表达 式 


lambda 表达 式 可 以 用 来 声明 匿名 函数 , 即 没 有 函数 名 字 的 临时 使 用 的 小 函数 。lambda 
表达 式 只 可 以 包含 一 个 表达 式 ,不 允许 包含 其 他 复杂 的 语句 ,但 在 表达 式 中 可 以 调用 其 他 函 
数 , 该 表达 式 的 计算 结果 是 函数 的 返回 值 。 下 面 的 代码 演示 了 不 同情 况 下 lambda 表达 式 的 
应 用 。 
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>>> f =lambda x,y,z:xty*tz 
>>>print f (1,2,3) 
6 
>>>g =lambda x,y=2,2=3:xty+z 
>>>print g(1) 
6 
>>>print g(2, z=4, y=5) 
11 
>>> L= [ (lambda x:x**2), (lambda x:x**3), (lambda x:x**4)] 
>>>print L[0] (2), L[1] (2), L[2] (2) 
4816 
>>> D= ('£1': (lambda:2+ 3) , '£2' : (lambda:2* 3), ' £3' : (lambda:2**3) } 
>>>print D['f1'] 0, D['£2'] 0, D['£3'10 
568 
>>> L= [1,2,3,4,5] 
>>>print map ( (lambda x:x+ 10), L) 
[11, 12, 13, 14, 15] 
>>> 工 
[1, 2, 3, 4, 5] 
>>>def demo (n) : 
return n* n 
»»» demo (5) 
25 
»»»a list = [1,2,3,4,5] 
>>>map (lambda x:demo(x), a list) 
[1, 4, 9, 16, 25] 
»»»data = list (range (20) ) 
>>>print data 
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19] 
>>> import random 
>>> random. shuffle (data) 
>>>data 
[4, 3, 11, 13, 12, 15, 9, 2, 10, 6, 19, 18, 14, 8, 0, 7, 5, 17, 1, 16] 
>>> data.sort (key= lambda x:x) # 用 在 列表 的 sort () 方 法 中 
>>> data 
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19] 
»»»data.sort (key- lambda x:len (str (x))) 
>>> data 
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19] 
>>> data.sort (key= lambda x:len(str(x)), reverse- True) 
>>>data 


[10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 
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5.7 高 级 话题 


在 本 章 的 最 后 ,我 们 来 看 几 个 高 级 一 点 的 话题 ,包括 map() ,reduceO ,filter()、 生 成 器 
以 及 Python 字 节 码 的 知识 。 

(1) 内 置 函 数 map() 可 以 将 一 个 单 参数 函数 依次 作用 到 一 个 序列 或 迭代 器 对 象 的 每 个 
元 素 上 ,并 返回 一 个 列表 作为 结果 ,该 列表 中 的 每 个 元 素 是 原 序列 中 的 元 素 经 过 函数 处 理 后 
的 结果 ,该 函数 不 对 原 序 列 或 迭代 器 对 象 做 任何 修改 。 


>>>map (str, range (5)) 
| Naa Ui a ar eS ea | 
>>> def add5 (v): 
return vt5 
»»»map (add5, range (10) ) 
[5, 6, 7, 8, 9, 10, 11, 12, 13, 14] 


(2) 内 置 函 数 reduce() 可 以 将 一 个 接受 2 个 参数 的 函数 以 累积 的 方式 从 左 到 右 依次 作 
用 到 一 个 序列 或 迭代 器 对 象 的 所 有 元 素 上 。 


>>> seq= [1,2,3,4,5,6,7,8,9] 
>>> reduce (lambda x, y:x*y, seq) 
45 
»»»def add(x, y): 
return x +y 
>>> reduce (add, range (10) ) 
45 


上 面 的 代码 运行 过 程 如 图 5-2 所 示 。 

类 似 的 运算 并 不 局 限于 数值 类 型 ,例如 ,下 面 的 代码 使 用 前 面 定义 的 函数 add() 实 现 了 
字符 串 连接 。 

>>> reduce (add,map (str, range (10) ) ) 

"0123456789" 


注 : 在 Python 3 中 ,使 用 reduce() 函 数 需要 先 从 functools 模块 导入 , 即 
from functools import reduce 


(3) A PRR filter() 将 一 个 单 参数 函数 作用 到 一 个 序列 上 ,返回 该 序列 中 使 得 该 函数 
返回 值 为 True 的 那些 元 素 组 成 的 列表 、 元 组 或 字符 串 。 


»»»seq- ['foo','x41','21',' * x « '] 
»»»def func(x): 
return x.isalnum() 
>>> filter (func, seq) 
['£oo', 'x4l'] 
>>> seq 


45 


图 5-2 reduce 过 程 示意 图 


['foo', "x41", '2!', "4 x « '] 
»»» [x for x in seq if x.isalnum()] 
['£oo', 'x41'] 

>>> filter (lambda x:x.isalnum(),seq) 
['£oo', 'x41'] 


(4) 包含 yield 语句 的 函数 用 来 创建 生成 器 。 和 迭代 器 的 最 大 特点 是 惰性 求 值 , 它 尤其 适 


用 于 大 数据 处 理 。 


»»»def f(): 
a, b=1, 1 
while True: 
yielda 
a, b =b, atb 
>>>a =£() 
>>> for i in range (10): 
print(a. next (), end-' ') 


11235813213455 
上 面 定义 的 生成 器 函数 还 可 以 这 样 使 用 : 


>>>for iin £(): 
if i>100: 
break 
print (i, end-' ') 
1123581321 3455 89 
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C5) 使 用 dis 模块 的 功能 可 以 查看 函数 的 字 节 码 指令 。 


»»»def add(n): 
nt=1 
return n 

>>> import dis 

>>> dis.dis (add) 


2 0 LOAD FAST 0 (n) 
3 LOAD CONST 1) 
6 INPLACE ADD 
7 STORE FAST 0 (n) 
3  10LOAD FAST 0 (n) 


13 RETURN VALUE 


本 章 知 识 精 要 


(1) 函数 是 用 来 实现 代码 复 用 的 常用 方式 。 

(2) 定义 函数 时 使 用 关键 字 def. 

(3) 定义 函数 时 不 需要 指定 其 形 参 类 型 ,而 是 根据 调用 函数 时 传递 的 实 参 自动 进行 
推断 。 

(4) 定义 函数 时 可 以 为 形 参 设置 默认 值 , 如 果 调 用 该 函数 时 不 为 默认 值 参 数 传递 参数 ， 
将 自动 使 用 默认 值 。 

(5) 传递 参数 时 可 以 使 用 关键 参数 ,避免 牢记 参数 顺序 的 麻烦 。 

(6) 定义 函数 时 , 形 参 前 面 加 一 个 星 号 表示 可 以 接收 多 个 实 参 并 将 其 放置 到 一 个 元 组 
中 , 形 参 前 面 加 两 个 星 号 表示 可 以 接收 多 个 “ 键 - 值 对 ”参数 并 将 其 放置 到 字典 中 。 

(7) 调用 函数 时 ,在 实 参 前 面 加 一 个 星 号 表示 进行 序列 解 包 ,可 以 将 序列 中 的 值 依次 赋 
值 给 相应 数量 的 形 参 。 

(8) 定义 函数 时 不 需要 指定 其 返回 值 的 类 型 ,而 是 由 return 语句 来 决定 ,如 果 函 数 中 没有 
return 语句 或 执行 了 不 返回 任何 值 的 return 语句 , 则 Python 认为 该 函数 返回 空 值 None, 


j 8 


1. 运行 5.3. 1 节 最 后 的 示例 代码 ,查看 结果 并 分 析 原 因 。 

2. 编写 函数 ,判断 一 个 整数 是 否 为 素数 ,并 编写 主 程序 调用 该 函数 。 

3. 编写 函数 ,接收 一 个 字符 串 ,分 别 统计 大 写字 母 、 小 写字 母 、 数 字 、 其 他 字符 的 个 数 ， 
并 以 元 组 的 形式 返回 结果 。 

4. 在 Python 程序 中 ,局 部 变量 会 隐藏 同名 的 全 局 变量 吗 ? 请 编写 代码 进行 验证 。 

5. 编写 函数 ,可 以 接收 任意 多 个 整数 并 输出 其 中 的 最 大 值 和 所 有 整数 之 和 。 

6. 编写 函数 ,模拟 内 置 函数 sum() 。 

7. 编写 函数 ,模拟 内 置 函 数 sorted()。 
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mom 面向 对 象 程序 设计 


面向 对 象 程序 设计 (Object Oriented Programming,OOP) 的 思想 主要 针对 大 型 软件 设 
计 而 提出 ,使 得 软件 设计 更 加 灵活 ,能 够 很 好 地 支持 代码 复 用 和 设计 复 用 ,并 且 使 得 代码 具 
有 更 好 的 可 读 性 和 可 扩展 性 。 面 向 对 象 程序 设计 的 一 条 基本 原则 是 计算 机 程序 由 多 个 能 够 
起 到 子 程序 作用 的 单元 或 对 象 组 合 而 成 .这 大 大 地 降低 了 软件 开发 的 难度 ,使 得 编程 就 像 搭 
积木 一 样 简单 。 面 向 对 象 程序 设计 的 一 个 关键 性 观念 是 将 数据 以 及 对 数据 的 操作 封装 在 一 
起 ,组 成 一 个 相互 依存 ,不 可 分 割 的 整体 , 即 对 象 。 对 于 相同 类 型 的 对 象 进行 分 类 、 抽 象 后 ， 
得 出 共同 的 特征 而 形成 了 类 ,面向 对 象 程序 设计 的 关键 就 是 如 何 合理 地 定义 和 管理 这 些 类 
以 及 类 之 间 的 关系 。 

Python 完全 采用 了 面向 对 象 程序 设计 的 思想 ,是 真正 面向 对 象 的 脚本 语言 ,完全 支持 
面向 对 象 的 基本 功能 ,如 封装 、 继 承 、 多 态 以 及 对 基 类 方法 的 覆盖 或 重 写 。 但 与 其 他 面向 对 
象 程序 设计 语言 不 同 的 是 ,Python 中 对 象 的 概念 很 广泛 ,Python 中 的 一 切 内 容 都 可 以 称 为 
对 象 ,而 不 一 定 必 须 是 某 个 类 的 实例 。 例 如 ,字符 串 、 列 表 、 字 典 、 元 组 等 内 置 数据 类 型 都 具 
有 和 类 完全 相似 的 语法 和 用 法 。 创 建 类 时 用 变量 形式 表示 的 对 象 属性 称 为 数据 成 员 或 成 员 
属性 ,用 函数 形式 表示 的 对 象 行为 称 为 成 员 函 数 或 成 员 方 法 ,成 员 属 性 和 成 员 方 法 统称 为 类 
的 成 员 。 


6.1 类 的 定义 与 使 用 


Python 使 用 class 关键 字 来 定义 类 ,class 保留 字 之 后 是 一 个 空格 ,然后 是 类 的 名 字 , 再 
然后 是 一 个 冒号 ,最 后 换行 并 定义 类 的 内 部 实现 。 类 名 的 首 字母 一 般 要 大 写 ,当然 也 可 以 按 
照 自己 的 习惯 定义 类 名 ,但 是 一 般 推荐 参考 惯例 来 命名 ,并 在 整个 系统 的 设计 和 实现 中 保持 
风格 一 致 ,这 一 点 对 于 团队 合作 尤其 重要 。 例 如 : 

class Car: # 新 式 类 必须 有 至 少 一 个 基 类 

def infor (self): 
print(" This is a car ") 

类 的 所 有 实例 方法 都 必须 至 少 有 一 个 名 为 self 的 参数 ,并 且 必须 是 方法 的 第 一 个 形 参 
(如 果 有 多 个 形 参 的 话 ) ,self 参数 代表 将 来 要 创建 的 对 象 本 身 。 在 类 的 实例 方法 中 访问 实 
例 属 性 时 需要 以 self 为 前 级, 但 调用 对 象 方法 时 并 不 需要 传递 这 个 参数 。 

注 : 在 定义 类 的 方法 时 ,一 般 习惯 将 第 一 个 参数 定义 为 self, 但 实际 上 类 的 实例 方法 中 
第 一 个 参数 的 名 字 是 可 以 变化 的 ,而 不 必须 使 用 self 这 个 名 字 ,例如 : 

»»»class A: 


def init (hahaha,v): 
hahaha.value =v 
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def show (hahaha) : 
print hahaha.value 

>>>a =A(3) 

>>>a.show() 

3 


属性 有 两 种 : 一 种 是 实例 属性 ; 另 一 种 是 类 属性 。 实 例 属 性 一 般 是 指 在 构造 函数 
_init_() 中 定义 的 ,定义 时 以 self 作为 前 级 ;类 属性 是 在 类 中 所 有 方法 之 外 定义 的 数据 成 
员 。 在 主 程序 中 (或 类 的 外 部 ) ,实例 属性 属于 实例 (对 象 ), 只 能 通过 对 象 名 访问 ,而 类 属性 
属于 类 ,可 以 通过 类 名 或 对 象 名 访问 。 

在 类 的 方法 中 可 以 调用 类 本 身 的 其 他 方法 ,也 可 以 访问 类 属性 以 及 对 象 属性 。 在 
Python 中 比较 特殊 的 是 ,可 以 动态 地 为 类 和 对 象 增加 成 员 , 这 一 点 是 和 很 多 面向 对 象 程序 
设计 语言 不 同 的 ,也 是 Python 动态 类 型 特点 的 一 种 重要 体现 。 


class Car: 
price =100000 # 定 义 类 属性 
def init (self, c): 
self.color =c # 定 义 实例 属性 


carl =Car ("Red") 
car2 =Car ("Blue") 


print carl.color, Car.price 


Car.price -110000 # 修 改 类 属性 
Car.name = 'QQ' # 增 加 类 属性 
carl.color = "Yellow" # 修改 实 例 属性 


print car2.color, Car.price, Car.name 


print carl.color, Car.price, Car.name 


Python 并 没有 对 私有 成 员 提供 严格 的 访问 保护 机 制 。 在 定义 类 的 属性 时 ,如 果 属 性 名 
以 两 个 下 划 线 ” “开头 则 是 私有 属性 ,和 否则 是 公有 属性 。 私 有 属性 在 类 外 不 能 直接 访问 , 需 
要 通过 调用 对 象 的 公有 成 员 方 法 来 访问 ,或 者 通过 Python 支持 的 特殊 方式 来 访问 。 
Python 提供 了 访问 私有 属性 的 特殊 方式 ,可 用 于 程序 的 测试 和 调试 ,对 于 成 员 方法 也 具有 
同样 的 性 质 。 
私有 属性 是 为 了 数据 封装 和 保密 而 设 的 属性 ,一 般 只 能 在 类 的 成 员 方法 (类 的 内 部 ) 中 
使 用 访问 ,虽然 Python 支持 一 种 特殊 的 方式 来 从 外 部 直接 访问 类 的 私有 成 员 , 但 是 并 不 推 
荐 读者 这 样 做 。 公 有 属性 是 可 以 公开 使 用 的 , 既 可 以 在 类 的 内 部 进行 访问 ,也 可 以 在 外 部 程 
序 中 使 用 。 
>>> class A: 
def init (self, valuel =0, value2 =0): 
self. valuel =valuel 
self. value? -value2 
def setValue (self, valuel, value2) : 
self. valuel =valuel 
self. value2 =value2 


def show(sel£) : 
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print self. valuel 
print self. value2 
>>>a =A() 


>>>a._valuel 


0 

>>>a. A valen ””# 在 外 部 访问 对 象 的 私有 数据 成 员 

0 

在 IDLE 环境 中 ,在 对 象 或 类 名 后 面 加 上 一 个 圆 点 ".”, 稍 等 一 会 则 会 自动 列 出 其 所 有 


公开 成 员 ,例如 图 6-1 所 示 ,模块 也 具有 同样 的 特点 。 
如 果 在 圆 点 “. ”后面 再 加 一 个 下 划 线 , 则 会 列 出 该 对 象 或 类 的 所 有 成 员 ,包括 私有 成 员 ， 
如 图 6-2 所 示 。 


ke E 
2» af - 
图 6-1 列 出 对 象 公开 成 员 图 6-2 列 出 对 象 所 有 成 员 


在 Python 中 ,以 下 划 线 开头 的 变量 名 有 特殊 的 含义 ,尤其 是 在 类 和 模块 的 定义 中 。 用 
下 划 线 作为 变量 前 级 和 后 级 来 表示 类 的 特殊 成 员 。 

(1) _xxx: 这 样 的 对 象 称 为 保护 变量 ,不 能 用 from module import *' 导 入 ,只 有 类 对 象 
和 子 类 对 象 能 访问 这 些 变 量 。 

(2). xxx 5 系统 定义 的 特殊 成 员 。 

G) xxx: 类 中 的 私有 成 员 , 只 有 类 对 象 自己 能 访问 , 子 类 对 象 也 不 能 访问 这 个 成 员 ， 
但 在 对 象 外 部 可 以 通过 “对 象 名 ._ 类 名 _xxx” 这 样 的 特殊 方式 来 访问 。Python 中 不 存在 真 
正 意义 上 的 私有 成 员 。 

另外 ,在 IDLE 交互 模式 下 ,一 个 下 划 线 “_” 表 示 解 释 器 中 最 后 一 次 显示 的 内 容 或 最 后 
一 次 语句 正确 执行 的 输出 结果 。 例 如 : 


55>3#5 
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3 
>>>1/0 


Traceback (most recent call last): 
File "<pyshell#2>", line 1, in <module> 
1/0 
ZeroDivisionError: integer division or modulo by zero 
>>>_ 
3 


下 面 的 代码 演示 了 特殊 成 员 定义 和 访问 的 方法 。 


>>> class Fruit: 
def init (self): 
Self. color -'Red' 
self.price =1 


»»»apple -Fruit() 


»»»apple.price # 显 示 对 象 公 开 数据 成 员 的 值 
1 

>>>apple.price =2 # 修 改 对 象 公开 数据 成 员 的 值 
»»»apple.price 

2 

>>>print apple.price, apple. Fruit color # 显 示 对 象 私 有 数据 成 员 的 值 
2 Red 

>>>apple. Fruit color ="Blue" # 修改 对 象 私有 数据 成 员 的 值 
>>>print apple.price, apple. Fruit color 

2 Blue 

»»»print apple. color # 不 能 直接 访问 对 象 的 私有 数据 成 员 , 出 错 


Traceback (most recent call last): 
File "<pyshell#16>", line 1, in <module> 
print(apple. color) 
AttributeError: Fruit instance has no attribute ' color' 
»»»peach -Fruit() 
>>>print peach.price, peach. Fruit color 
1 Red 


6.2 类 的 方法 


类 的 方法 可 以 粗略 分 为 四 大 类 : 公有 方法 .私有 方法 .静态 方法 和 类 方法 。 其 中 ,公有 
方法 、 私 有 方法 都 属于 对 象 ,每 个 对 象 都 有 自己 的 公有 方法 和 私有 方法 ,在 这 两 类 方法 中 可 
以 访问 属于 类 和 对 象 的 成 员 ; 公 有 方法 通过 对 象 名 直接 调用 ,私有 方法 不 能 通过 对 象 名 直接 
调用 ,只 能 在 属于 对 象 的 方法 中 通过 self 调用 或 在 外 部 通过 Python 支持 的 特殊 方式 来 调 
用 ;静态 方法 和 类 方法 都 可 以 通过 类 名 和 对 象 名 调用 .但 不 能 访问 属于 对 象 的 成 员 , 只 能 访 
问 属于 类 的 成 员 。 
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>>> class Root: 
. total =0 
def init (self,v): 
self. value =v 
Root. total4-1 
def show (self): 
print 'self. value:',self. value 


print 'Root. total:',Root. total 


@classmethod 

def classShowTotal (cls) : # 类 方法 
print cls. total 

@staticmethod 

def staticShowTotal () : # 静 态 方法 


print Root. total 
>>> r =Root (3) 


»»»r.classShowTotal () # 通 过 对 象 来 调用 类 方法 

1 

>>> r.staticShowTotal () # 通 过 对 象 来 调用 静态 方法 
1 


»»»r.show() 

self. value: 3 
Root. total: 1 
>>> rr =Root (3) 


>>> Root .classShowTotal () # 通 过 类 名 调用 类 方法 
»»»Root.staticShowTotal.() # 通 过 类 名 调用 静态 方法 
»»»Root.show () # 试 图 通过 类 名 直接 调用 实例 方法 ,失败 


Traceback (most recent call last): 

File "<pyshell#9>", line 1, in <module> 

Root.show() 

TypeError: unbound method show () must be called with Root instance as first argument (got 
nothing instead) 
»»»Root.show(r) # 可 以 通过 这 种 方法 来 调用 方法 并 访问 实例 成 员 
self. value: 3 
Root. total: 2 
»»»r.show() 
self. value: 3 


Root. total: 2 


6.3 类 的 属性 


Python 2. x 和 Python 3. x 对 属性 的 处 理 方式 不 一 样 ,有 较 大 的 差异 ,使 用 时 应 注意 两 
者 之 间 的 区 别 。 需 要 注意 的 是 ,本 节 中 “属性 ” 指 狭义 的 概念 .与 前 面 所 谈 的 “属性 ”概念 并 不 
完全 一 样 。 
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6.3.1 Python 2.x 中 的 属性 


在 Python 2 中 ,使 用 @property 来 声明 一 个 属性 ,然而 属性 并 没有 得 到 真正 的 实现 ,也 


没有 提供 应 有 的 访问 保护 机 制 。 正 如 前 面 所 说 ,在 Python 中 ,可 以 为 类 和 对 象 动态 增加 新 
成 员 。 在 Python 2 中 ,为 对 象 增加 新 的 数据 成 员 时 ,将 隐藏 同名 的 已 有 属性 。 例 如 下 面 的 
Python 2. 7. 8 代码 : 


»»»class Test: 
def init (self, value): 
self. value =value 
@property 
def value (self): 
return self. value 
>>>a =Test (3) 
>>>a.value 
3 
>>>a.value =5 # 动 态 添加 新 成 员 ,隐藏 了 定义 的 属性 
>>>a.value 
5 
»»»t. Test value # 原 来 的 私有 变量 没有 改变 
3 


除了 动态 增加 成 员 时 会 隐藏 已 有 属性 ,下 面 的 代码 从 表面 看 来 是 修改 属性 的 值 ,而 实际 


上 也 是 增加 了 新 成 员 , 从 而 隐藏 了 已 有 属性 。 
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>>> class Test: 
def init (self, value): 
self. value -value 
def get (self): 
return self. value 
def set(self, v): 
self. value =v 
value -property( get, set) 
def show (self): 
print self. value 
»»»t -Test(3) 


>>>t.value 


3 

>>>t.value +=2 # 动 态 添加 了 新 成 员 

>>>t.value # 这 里 访问 的 是 新 成 员 

5 

»»»t.show() # 访 问 原来 定义 的 私有 数据 成 员 

3 

>>> del t.value # 这 里 删除 的 是 刚才 添加 的 新 成 员 
>>>t.value 专访 问 原来 的 属性 


3 


>>> del t.value # 试 图 删除 属性 

出 错 信息 OR) 

AttributeError: Test instance has no attribute 'value' 

»»»delt. Test value + BRA A 

>>> t.value # 访 问 属性 ,但 该 属性 对 应 的 私有 成 员 已 不 存在 
出 错 信息 OR) 


AttributeError: Test instance has no attribute ' Test value' 


下 面 的 代码 则 更 加 清楚 地 演示 了 Python 2 中 私有 成 员 和 普通 成 员 之 间 的 关系 ,希望 能 
帮助 您 理解 上 面 的 内 容 。 


>>> class Test: 
def show (self): 
print self.value 
print self. v 
>>>t =Test () 
>>> t.show () 
出 错 信息 略 ) 
AttributeError: Test instance has no attribute 'value' 
»»»t.value =3 
»»»t.show() 
3 
出 错 信息 略 ) 
AttributeError: Test instance has no attribute ' Test v" 
»»t. v-5 
»»»t.show() 
3 
出 错 信息 略 ) 
AttributeError: Test instance has no attribute ' Test v" 
>>>t. Test v-5 
»»»t.show() 
3 
5 


6.3.2 Python 3.x 中 的 属性 


在 Python 3 中 ,属性 得 到 了 较为 完整 的 实现 ,支持 更 加 全 面 的 保护 机 制 。 如 下 面 的 代 
码 所 示 , 如 果 设 团 属 性 为 只 读 , 则 无 法 修改 其 值 , 也 无 法 为 对 象 增 加 与 属性 同名 的 新 成 员 , 同 
时 ,也 无 法 删除 对 象 属性 。 例 如 ,下 面 的 代码 运行 在 Python 3.4.2 中 : 


>>> Class Test: 
def init (self, value): 
self. value =value 
@property 
def value (self): FARE ,无 法 修改 和 删除 
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return self. value 

>>>t =Test (3) 

>>>t.value 

3 

>>> t.value =5 

出 错 信息 ( 略 ) 

AttributeError: can't set attribute 

»t.v-5 + Bh ASS MIRA 
>>>t.v 

5 

>>>del t.v ## 动 态 删除 成 员 
>>> del t.value 坦 试图 删除 对 象 属性 ,失败 
出 错 信息 略 ) 

AttributeError: can't delete attribute 
>>>t.value 

3 


下 面 的 代码 则 把 属性 设置 为 可 读 、 可 修改 ,而 不 允许 删除 。 


>>> class Test: 
def init (self, value): 
self. value =value 
def get (self): 
return self. value 
def  set(self, v): 
self. value-v 
value -property( get, set) 
»»»t -Test(3) 
»»»t.value # 人 允许 读 取 属 性 值 
3 
>>>t.value =5 # 人 允许 修改 属性 值 
>>>t.value 
5 
>>>del t.value # 试 图 删除 属性 ,失败 
出 错 信息 


AttributeError: can't delete attribute 
当然 ,也 可 以 将 属性 设置 为 可 读 、 可 修改 .可 删除 。 


>>> class Test: 
def init (self, value): 
self. value =value 
def get(self): 
return self. value 
def set (self, v): 
self. value =v 


def  del(self): 
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del self. value 

value -property( get, set, del) 

def show (self): 

print(self. value) 

>>>t =Test (3) 
»»»t.show() 
3 
»»»t.value 
3 
»»»t.value =5 
»»»t.show() 
5 
»»»t.value 
5 
>>>del t.value 
»»»t.value 
出 错 信息 ( 略 ) 
AttributeError: 'Test' object has no attribute ' Test value' 
»»»t.show() 
出 错 信息 ( 略 ) 
AttributeError: 'Test' object has no attribute ' Test value" 
»»»t.value =1 # 为 对 象 动 态 增加 属性 和 对 应 的 私有 数据 成 员 
»»»t.show() 
1 
>>> t.value 
1 


6.4 类 的 特殊 方法 


Python 类 有 大 量 的 特殊 方法 ,比较 常见 的 是 构造 函数 和 析 构 函数 。Python 中 类 的 构 
造 函数 是 _init_0 〇 ,一般 用 来 为 数据 成 员 设置 初 值 或 进行 其 他 必要 的 初始 化 工作 ,在 创建 
对 象 时 自动 执行 。 如 果 用 户 没 有 设计 构造 函数 ,Python 将 提供 一 个 默认 的 构造 函数 用 来 进 
行 必要 的 初始 化 工作 。Python 中 类 的 析 构 函数 是 _del_0 〇 ,一 般 用 来 释放 对 象 占用 的 资 
源 , 在 Python 删除 对 象 和 收回 对 象 空间 时 自动 执行 。 如 果 用 户 没有 编写 析 构 函数 ,Python 
将 提供 一 个 默认 的 析 构 函数 进行 必要 的 清理 工作 。 

在 Python 中 ,除了 构造 函数 和 析 构 函数 之 外 ,还 有 大 量 的 特殊 方法 支持 更 多 的 功能 ,例如 
运算 符 重 载 就 是 通过 在 类 中 重 写 特殊 函数 来 实现 的 。 表 6-1 列 出 了 其 中 一 部 分 特殊 方法 。 

表 6-1 Python 类 特殊 方法 


方 法 功能 说 明 
_init_O 构造 函数 ,生成 对 象 时 调用 
_del_O 析 构 函数 ,释放 对 象 时 调用 
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续 表 


方 


法 


功能 说 明 


. add O, radd O 


sub O 


. mul O 


. div O,. truediv O 


Python 2 使 用 _div_0O 〇 ,Python 3 使 用 _truediv_() 


- floordiv .O 整除 

. mod O % 

pow O * 

. emp (O 比较 运算 

_repr_() 打印 ,转换 
_setitem_O 按照 索引 赋值 
__getitem_( 按照 索引 获取 值 
_len_() 计算 长 度 

call OO 函数 调用 
__contains () 测试 是 否 包含 某 个 元 素 
eq O, ne O, lt O, le O, c dmm Eres 
-8t O.. ge O 

str oO 转化 为 字符 串 
_Ishift__O ._rshift_O <a> 
and_(),_or_(,_invert_O &.l.— 


. iadd (O,. isub (O 


下 面 通过 一 个 示例 来 演示 特殊 方法 的 用 法 。 


【 例 6-1] 


# Filename: MyArray.py 


自 定义 数组 类 。 


# Function description: Array and its operating 


import types 


class MyArray: 


"All the elements in this array must be numbers " 


. value =[] 


size =0 


def  IsNumber(self, n): 
if type(n) !=types.ComplexType and type(n) !=types.FloatType V 
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and type(n) !=types.IntType and type(n) !=types.LongType: 
return False 


return True 


def init (self, *args): 
for arg in args: 
if not self. IsNumber (arg): 
print 'All elements must be numbers" 
return 
self. value = [] 
for arg in args: 
self. value.append(arg) 


self. size = len (args) 


def add (self, n): 
if not self. IsNumber (n): 
print '+ operating with ', type(n), ' and number type is not supported." 
return 
b =MyArray () 
for v in self. value: 
b. value.append(v +n) 


return b 


def sub (self, n): 
if not self. IsNumber (n): 
print '-operating with ', type(n), ' and number type is not supported." 
return 
b =MyArray () 
for vin self. value: 
b. value.append(v -n) 


returnb 


def mul (self, n): 
if not self. IsNumber(n): 
print '* operating with ', type(n), ' and number type is not supported. ' 
return 
b =MyArray () 
for v in self. value: 
b. value.append(v * n) 


returnb 


def div (self, n): 
if not self. IsNunber(n): 
print r'/ operating with ', type(n), ' and number type is not supported." 
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return 

if type(n) ==types.IntType: 
n -£loat(n) 

b -MyArray () 

forvinself. value: 
b. value.append(v / n) 


returnb 


def mod (self, n): 
if not self. IsNumber (n): 
print r'&operating with ', type(n), ' and number type is not supported. ' 
return 
b =MyArray () 
for v in self. value: 
b. value.append(v $n) 


return b 


def pow (self, n): 
if not self. IsNumber (n): 
print '** operating with ', type(n), ' and number type is not supported." 
return 
b -MyArray() 
forvinself. value: 
b. value.append(v * * n) 


return b 


def len (self): 


return len(self. value) 


#for: x 


#when use the object as a statement directly, the function will be called 
def repr (self): 


# equivalent to return 'self. value" 


return repr(self. value) 


# for: print x 
def str (self): 


return str (self. value) 


def append (self, v): 
if not self. IsNumber(v): 
print 'Only number can be appended. ' 
return 


self. value.append(v) 


self. size +=1 


def  getitem (self, index): 
if self. IsNumber(index) and 0 <=index <=self. size: 
return self. value[index] 
else: 


print 'Index out of range.' 


def  setitem (self, index, v): 
if self. IsNumber(index) and 0 «- index «- self. size: 
if self. IsNumber (v): 
self. value[index] -v 
else: 
print v, ' is not a number" 
else: 


print index, ' is not a number or out of range." 


#member test. support the keyword 'in' 
def contains (self, v): 
ifvinself. value: 
return True 


return False 


# dot product 
def dot (self, v): 
if not isinstance (v, MyArray): 
print v, ' must be an instance of MyArray." 
return 
if len(v) !-self. size: 
print 'The size must be equal." 
return 
b =MyArray () 
form,ninzip(v. value, self. value): 
b. value.append(m * n) 


return sum(b. value) 


#equal to 
def eq (self, v): 
if not isinstance (v, MyArray): 
print v, ' must be an instance of MyArray.' 


return 


if cmp (self. value, v. value) == 


return True 


return False 
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# less than 
def 1t (self, v): 
if not isinstance (v, MyArray): 
print v, ' must be an instance of MyArray.' 
return 
if cmp (self. value, v. value) «0: 


return True 


return False 


if name == 


print 'Please use me as a module.' 


将 上 面 的 代码 保存 为 My Array. py 文件 之 后 ,将 其 作为 模块 导入 来 使 用 ,简单 演示 
如 下 : 


>>> import MyArray 

>>>a -MyArray.MyArray (1,2,3,4,5,6) 
>>>b -MyArray.MyArray (6,5,4,3,2,1) 
>>> len (a) 

6 

>>> a.dot (b) 

56 

>>>a <b 

True 

>>>a >b 

False 

>>>a==a 

True 

>>>3 ina 

True 

»»a* 3 

[3, 6, 9, 12, 15, 18] 

>>>a +2 

让 本 | 
»»a**2 

[1, 4, 9, 16, 25, 36] 

>>>a /2 

[0.5, 1.0, 1.5, 2.0, 2.5, 3.0] 
>>>a 

[1, 2, 3, 4, 5, 6] 

>>>a[0] =8 

>>>a 


[8, 2, 3, 4, 5, 6] 
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6.5 继承 机 制 


继承 是 为 代码 复 用 和 设计 复 用 而 设计 的 ,是 面向 对 象 程序 设计 的 重要 特性 之 一 。 当 设 
计 一 个 新 类 时 ,如 果 可 以 继承 一 个 已 有 的 设计 良好 的 类 然后 进行 二 次 开发 ,无 疑 会 大 幅度 减 
少 开发 工作 量 。 在 继承 关系 中 ,已 有 的 ,设计 好 的 类 称 为 父 类 或 基 类 ,新 设计 的 类 称 为 子 类 
或 派生 类 。 派 生 类 可 以 继承 父 类 的 公有 成 员 , 但 是 不 能 继承 其 私有 成 员 。 

Python 支持 多 继承 ,如 果 父 类 中 有 相同 的 方法 名 ,而 在 子 类 中 使 用 时 没有 指定 父 类 名 ， 
Jl] Python 解释 器 将 从 左 向 右 按 顺 序 进行 搜索 。 

【 例 6-2] 设计 Person 类 ,并 根据 Person 类 派生 Teacher 类 ,分 别 创建 Person 类 与 
Teacher 类 的 对 象 。 


import types 
class Person (cbject) : # 基 类 必须 继承 于 cbject, 和 否则 在 派生 类 中 将 无 法 使 用 super 0 PR C 
def init (self, name -'', age =20, sex = 'man!): 


self.setName (name) 
self.setAge (age) 
self.setSex (sex) 
def setName (self, name): 
if type(name) !=types.StringType: 
print 'name must be string." 
return 
self. name =name 
def setAge (self, age): 
if type(age) !=types.IntType: 
print 'age must be integer." 
return 
Self. age =age 
def setSex(self, sex): 
if sex != 'man' and sex != 'woman' : 
print 'sex must be "man" or "woman" ' 
return 
self. sex =sex 
def show (self): 
print self. name 


print self. age 


printself. sex 
class Teacher (Person): 
def init (self, name-'', age —30, sex = 'man', department = 'Computer'): 


# 调 用 基 类 构造 方法 初始 化 基 类 的 私有 数据 成 员 


super (Teacher, self). init (name, age, sex) 
#Person. init (self, name, age, sex) # 也 可 以 这 样 初始 化 基 类 的 私有 数据 成 员 
self.setDepartment (department) # 初 始 化 派生 类 的 数据 成 员 


def setDepartment (self, department): 
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if type (department) !=types.StringType: 
print "department must be a string." 
return 
self. department =department 
def show(self): 
super (Teacher, self) .show() 
print self. department 
if name --' main ': 
zhangsan = Person ('Zhang San', 19, 'man') 
zhangsan.show () 
lisi -Teacher('Li Si',32, 'man', 'Math') 


lisi.show() 
为 了 更 好 地 理解 Python 类 的 继承 机 制 , 我 们 来 看 下 面 的 代码 ,请 认真 体会 构造 函数 、 
私有 方法 以 及 普通 公开 方法 的 继承 原理 。 


>>>class A(): 
def init (self): 
self. private() 
self.public() 
def  private(self): 
print' private() method of A' 
def public (self): 
print 'public() method of A" 
»»»class B(A): 
def  private(self): 
print' private() method of B' 
def public (self): 
print 'public() method of B" 
>>>b=B() 
. private() method of A 
public() method of B 
>>>print '\n'.join (dir (b)) # 查 看 对 象 b 的 成 员 
.A private 
.B private 
| doc — 
— jnit — 
. module _ 
Public 
»»»class C(A): 
def init (self): 
self. private() 
self.public() 
def private (self): 
print ' private() method of C' 
def public (self): 
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print 'public() method of C' 
»c-C() 

. private() method of C 

public() method of C 

>>>print '\n'.join(dir(c)) 

_A private 

_C_ private 

_doc _ 
_init — 

. module | 
public 


本 章 知 识 精 要 


(1) 定义 类 时 使 用 关键 字 class. 

(2) Python 2. x 中 的 属性 并 没有 提供 完整 的 保护 机 制 。 

(3) 在 Python 中 ,运算 符 重 载 是 通过 重新 实现 一 些 特殊 函数 来 实现 的 。 

(4) Python 支持 多 继承 ,如 果 父 类 中 有 相同 的 方法 名 ,而 在 子 类 中 使 用 时 没有 指定 父 
类 名 , 则 Python 解释 器 将 从 左 向 右 按 顺 序 进行 搜索 。 


J3 题 
1. 继承 6.5 节 例 6-2 中 的 Person 类 生成 Student 类 ,填写 新 的 函数 用 来 设置 学 生 专 


业 , 然 后 生成 该 类 对 象 并 显示 信息 。 
2. 设计 一 个 三 维 向 量 类 ,并 实现 向 量 的 加 法 \ 减 法 以 及 向 量 与 标量 的 乘法 和 除法 运算 。 


3， 面 向 对 象 程序 设计 的 三 要 素 分 别 为 、 和 
4. 简单 解释 Python 中 以 下 划 线 开头 的 变量 名 特点 。 
5. 与 运算 符 *x 对 应 的 特殊 方法 名 为 ,与 运算 符 // 对 应 的 特殊 方法 名 


为 
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第 7 章 文件 操作 


为 了 长 期 保存 数据 以 便 重 复 使 用 、 修 改 和 共享 ,必须 将 数据 以 文件 的 形式 存储 到 外 部 存 
储 介质 (如 磁盘 、U 盘 、 光 盘 等 ) 或 云 盘 中 。 管 理 信息 系统 是 使 用 数据 库 来 存储 数据 的 ,而 数 
据 库 最 终 还 是 要 以 文件 的 形式 存储 到 硬盘 或 其 他 存储 介质 上 ,应 用 程序 的 配置 信息 往往 是 
使 用 文件 来 存储 的 ,图形 .图像 音频、 视频 .可 执行 文件 等 也 都 是 以 文件 的 形式 存储 在 磁盘 
上 的 。 因 此 ,文件 操作 在 各 类 软件 的 开发 中 均 占有 重要 的 地 位 。 

按 文件 中 数据 的 组 织 形式 可 以 把 文件 分 为 文本 文件 和 二 进 制 文件 两 大 类 。 

1. 文本 文件 

文本 文件 存储 的 是 常规 字符 串 , 由 若干 文本 行 组 成 ,通常 每 行 以 换行 符 \n 结尾 。 常 规 
字符 串 是 指 记事 本 或 其 他 文本 编辑 器 能 正常 显示 、 编 辑 并 且 人 类 能 够 直接 阅读 和 理解 的 字 
符 串 ,如 英文 字母 ,汉字 、 数 字 字 符 串 。 文 本 文件 可 以 使 用 字 处 理 软件 (如 gedit, it FAR 3E 
行 编辑 。 

2. 二 进 制 文件 

二 进 制 文件 把 对 象 内 容 以 字 节 串 (bytes) 进 行 存储 ,无 法 用 记事 本 或 其 他 普通 字 处 理 软 
件 直 接 进 行 编 辑 , 通 常 也 无 法 被 人 类 直接 阅读 和 理解 ,需要 使 用 专门 的 软件 进行 解码 后 读 
取 、 显 示 、 修 改 或 执行 。 常 见 的 如 图 形 图 像 文件 . 音 视频 文件 .可 执行 文件 .资源 文件 .各 种 数 
据 库 文件 .各 类 Office 文档 等 都 属于 二 进 制 文件 。 


7.1 文件 基本 操作 


无 论 是 文本 文件 还 是 二 进 制 文件 ,其 操作 流程 基本 都 是 一 致 的 , 即 : 首先 打开 文件 并 创 
建文 件 对 象 ,然后 通过 该 文件 对 象 对 文件 内 容 进 行 读 取 、 写 入 、 删 除 、 修 改 等 操作 ,最 后 关闭 
并 保存 文件 内 容 。Python 内 团 了 文件 对 象 ,通过 open() 函 数 可 以 按 指 定 模 式 打 开 指 定 文 
件 并 创建 文件 对 象 ,例如 : 


文件 对 象 名 =open 文件 名 [, 打开 方式 [, 缓冲 区 ]]) 


其 中 ,文件 名 指定 了 被 打开 的 文件 名 称 , 如 果 要 打开 的 文件 不 在 当前 目录 中 ,还 需要 指定 完 
整 路 径 ,为 了 减少 完整 路 径 中 \ 符 号 的 输入 ,可 以 使 用 原始 字符 串 : 打 开 模 式 ( 见 表 7-1) 指 定 
了 打开 文件 后 的 处 理 方式 ,例如 “只 读 ”、“ 读 写 ”“ 追 加 ”等 ;缓冲 区 指定 了 读 写 文件 的 缓存 模 
式 , 数 值 0 表示 不 缓存 ,数值 1 表示 缓存 ,如 大 于 1 则 表示 缓冲 区 的 大 小 ,默认 值 是 缓存 模 
式 。 如 果 执 行 正常 ,open() 函 数 返回 1 个 文件 对 象 ,通过 该 文件 对 象 可 以 对 文件 进行 各 种 操 
作 , 如 果 指 定 文件 不 存在 ,访问 权限 不 够 、 磁 盘 空 间 不 够 或 其 他 原因 导致 创建 文件 对 象 失败 
则 抛 出 异常 。 例 如 ,下 面 的 代码 分 别 以 读 、 写 方式 打开 了 两 个 文件 并 创建 了 与 之 对 应 的 文件 
对 象 。 


fl-open( 'filel.txt', 'r' ) 
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f2-open( 'file2.txt', 'w') 


当 对 文件 内 容 操作 完 以 后 ,一定 要 关闭 文件 ,以 保证 所 做 的 任何 修改 都 得 到 保存 。 


f£l.close() 


表 7-1 文件 打开 模式 


模式 说 明 模式 说 明 
读 模 式 b 二 进 制 模式 (可 与 其 他 模式 组 合 使 用 ) 
w 写 模式 * 读 、 写 模式 (可 与 其 他 模式 组 合 使 用 
a 追加 模式 


文件 对 象 常用 属性 如 表 7-2 所 示 。 


表 7-2 文件 对 象 常用 属性 


属 tt 说 明 

Closed 判断 文件 是 否 关闭 , 若 文件 被 关闭 , 则 返回 True 
Mode 返回 文件 的 打开 模式 

Name 返回 文件 的 名 称 


文件 对 象 常用 方法 如 表 7-3 所 示 。 


方 ” 法 


表 7-3 文件 对 象 常用 方法 
功能 说 明 


flushO 


把 缓冲 区 的 内 容 写 人 文件 ,但 不 关闭 文件 


close() 


把 缓冲 区 的 内 容 写 人 文件 ,同时 关闭 文件 ,并 释放 文件 对 象 


read([size]) 


从 文件 中 读 取 size 个 字 节 (Python 2. x) 或 字符 (Python 3. x) 的 内 容 作 为 结果 
返回 ,如 果 省 略 size 则 表示 一 次 性 读 取 所 有 内 容 


readline() 


从 文本 文件 中 读 取 一 行内 容 作为 结果 返回 


readlines() 


把 文本 文件 中 的 每 行文 本 作为 一 个 字符 串 存 人 列表 中 ,返回 该 列表 


seekCoffset[ ,whence]) 


把 文件 指针 移动 到 新 的 位 置 ,offset 表示 相对 于 whence 的 位 置 。whence 为 0 
表示 从 文件 头 开始 计算 ,Whence 为 1 表示 从 当前 位 置 开 始 计算 , Whence 为 2 
表示 从 文件 尾 开 始 计算 ,默认 为 0 


tell 


返回 文件 指针 的 当前 位 置 


truncate([size]) 


删除 从 当前 指针 位 置 到 文件 未 尾 的 内 容 。 如 果 指 定 了 size, 则 不 论 指针 在 什么 
位 置 都 只 留 下 前 size 个 字 节 ,其 余 的 删除 


write(s) 


把 字符 串 s 的 内 容 写 人 文件 


writelines(s) 


把 字符 串 列表 写 人 文本 文件 ,不 添加 换行 符 
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7.2. 文本 文件 基本 操作 


在 本 节 中 ,主要 通过 几 个 示例 来 演示 文本 文件 的 读 写 操作 。 对 于 read()、write() 以 及 


其 他 读 写 方法 , 当 读 写 操作 完成 之 后 ,都 会 自动 移动 文件 指针 ,如 果 需 要 对 文件 指针 进行 定 
位 ,可 以 使 用 seek() 方 法 ,如 果 需 要 获知 文件 指针 当前 位 置 可 以 使 用 tell( ) 方 法 。 


【 例 7-1]. 向 文本 文件 中 写 和 内容 。 


f =open('sample.txt', 'at') 
s = "文本 文件 的 读 取 方 法 Nn 文本 文件 的 写 人 方法 \n 
f.write(s) 

f.close() 

对 于 上 面 的 代码 ,更 建议 这 样 写 : 

s = "文本 文件 的 读 取 方 法 \n 文 本 文件 的 写 人 方法 \n' 
with open('sample.txt','at') as f: 


f.write(s) 


使 用 上 下 文 管理 关键 字 with 可 以 自动 管理 资源 ,不 论 何 种 原因 跳出 with 块 , 总 能 保证 


文件 被 正确 关闭 ,并且 可 以 在 代码 块 执行 完毕 后 自动 还 原 进入 该 代码 块 时 的 现场 。 


[917-2] 读 取 并 显示 文本 文件 的 前 5 个 字 节 。 
对 于 文件 对 象 的 read() 方 法 ,Python 2 和 Python 3 的 解释 略 有 不 同 , 尤 其 是 文本 文件 


中 包含 中 文 的 时 候 。Python 2 的 read() 方 法 是 读 取 文 件 中 指定 数量 的 字 节 , 对 于 中 文 可 能 
会 由 于 无 法 正常 解码 而 出 现 乱 码 。 例 如 ,假设 sample. txt 文件 的 内 容 为 “SDIBT 中 国 山 东 
烟台 ”, 那 么 在 Python 2.7. 8 中 代码 运行 结果 如 下 : 


>>> =open( 'sample.txt', 'r') 
>>>print fp.read(5) 

SDIBT 

>>>print fp.read(7) 

Óia 
>>>print fp.read(8) 
Ni 

»»»f.close() 


而 Python 3 对 中 文 支持 较 好 ,对 read() 方 法 的 解释 是 读 取 文件 中 指定 数量 的 字符 而 不 是 


字 节 ,中 文 和 英文 字母 同等 对 待 。 对 前 述 sample. txt 文件 ,Python 3. 4. 2 中 代码 运行 结果 如 下 : 
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>>> fp -open('sample.txt','r') 
>>> print (fp.read(5)) 

SDIBT 

>>> print (fp.read(7)) 

中 国 山 东 烟 台 

>>> fp.seek (0) 

0 


EEJ ERE E 


>>> print (fp.read(8)) 
SDIBT 中 国 山 


【 例 7-3]. 读 取 并 显示 文本 文件 所 有 行 。 


f =open('sample.txt', 'r') 
while True: 

line-f.readline () 

if line--'': 

break 

print line,# 逗 号 不 会 产生 换行 符 , 但 文件 中 有 换行 符 , 因 此 会 换行 


f.close() 
当然 ,也 可 以 这 样 来 写 : 


f =open (sample.txt', 'r') 
li =f.readlines () 
for line in li: 

print line, 


f.close() 


[517-4] 移动 文件 指针 。 

Python 2 和 Python 3 对 于 seek() 方 法 的 理解 和 处 理 是 一 致 的 ,即将 文件 指针 定位 到 文 
件 中 指定 字 节 的 位 置 。 但 是 由 于 对 中 文 的 支持 程度 不 一 样 ,可 能 会 导致 在 Python 2 和 
Python 3 中 的 运行 结果 有 所 不 同 。 例 如 ,下 面 的 代码 在 Python 3. 4. 2 中 运行 , 当 遇 到 无 法 
解码 的 字符 会 抛 出 异常 。 


>>>s= ' 中 国 山东 烟台 SDIBT' 

>>> fp =open(r'D:\sample.txt', 'w') 
>>> fp.write(s) 

11 

>>> fp.close () 

>>> fp =open(r'D:\sample.txt', 'r') 
>>> print (fp. read (3) ) 

中 国 山 

>>> fp.seek (2) 

2 

>>> print (fp.read(1)) 

>>> fp. seek (13) 

13 

>>> print (fp.read (1) ) 

D 

>>> fp. seek (15) 

15 

>>> print (fp.read (1) ) 

B 
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>>> fp.seek (3) 

3 

>>> print (fp.read (1)) 

出 错 信息 

UnicodeDecodeError: ' gbk ' codec can ' t decode byte 0xfa in position 0: illegal 
multibyte sequence 


而 在 Python 2. 7. 8 中 , 则 不 抛 出 异常 ,而 是 输出 乱码 ,例如 : 


>>>s =' 中 国 山东 烟台 SDIBT' 

>>> fp —open(r'D:Vsample.txt', 'w') 
>>> fp.write (s) 

>>> fp.close () 

>>> fp =open(r'D:\sample.txt', 'r') 
>>> print (fp.read (3) ) 

Om 

>>> fp.seek (2) 

>>> print (fp.read (3) ) 

aE 

>>> print (fp.read(2)) 


Lj 


7.3 ”二进制 文件 操作 


数据 库 文件 .图 像 文 件 、 可 执行 文件 、 音 视频 文件 和 Office 文档 等 均 属于 二 进 制 文件 。 
对 于 二 进 制 文件 ,不 能 使 用 记事 本 或 其 他 文本 编辑 软件 进行 正常 读 写 ,也 无 法 通过 Python 
的 文件 对 象 直接 读 取 和 理解 。 必 须 正确 理解 二 进 制 文件 结构 和 序列 化 规则 ,才能 准确 地 理 
解 二 进 制 文件 内 容 并 且 设 计 正 确 的 反 序列 化 规则 。 序 列 化 是 指 把 内 存 中 的 数据 在 不 丢失 其 
类 型 信息 的 情况 下 转 成 对 象 的 二 进 制 形式 表示 的 过 程 ,对 象 序列 化 后 的 形式 经 过 正确 的 反 
序列 化 过 程 应 该 能 够 准确 地 恢复 为 原 对 象 。 

Python 中 常用 的 序列 化 模块 有 struct、pickle、json、marshal 和 shelve, 其 中 pickle # C 
语言 实现 的 cPickle, 速 度 约 提 高 1000 倍 ,应 优先 考虑 使 用 。 在 本 节 中 ,主要 介绍 struct 和 
pickle 模块 在 对 象 序列 化 和 二 进 制 文件 操作 方面 的 应 用 ,其 他 模块 请 参考 有 关 文档 。 


7.3.1 使 用 pickle 模块 


pickle 是 较为 常用 并 且 速 度 非常 快 的 二 进 制 文件 序列 化 模块 ,下 面 通过 两 个 示例 来 了 
解 如 何 使 用 pickle 模块 进行 对 象 序列 化 和 二 进 制 文件 读 写 。 
【 例 7-5) 使 用 pickle 模块 写 入 二 进 制 文件 。 


import pickle 

f =open('sample_pickle..dat', 'wb') 
n=7 

i =13000000 

a =99.056 
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s-"PRAR 123abc' 
ist =[[1, 2, 3], [4, 5, 6], [7, 8, 9]] 
tu=(-5, 10, 8) 
coll ={4, 5, 6} 
dic - ('a':'apple', 'b':'banana', 'g':'grape', 'o':'orange'] 
try: 
pickle.dump(n, f) # 表 示 后 面 将 要 写 和 人 的 数据 个 数 
pickle.dump(i, f) # 把 整数 i RRALT T OB HS AH 
pickle.dump(a, f) 
pickle.dump(s, f) 
pickle.dump(lst, f) 
pickle.dump (tu, £) 
pickle.dump (coll, f) 
pickle.dump (dic, f) 
except: 
print ' 写 文件 异常 !" ADAE CEE RU BERI JC ADU 
finally: 


f.close() 
[517-6] 读 取 例 7-5 中 写 和 二进制 文件 的 内 容 。 


import pickle 
f —-open('sample pickle.dat', 'rb') 
n -pickle.load(f) # 读 出 文件 的 数据 个 数 
i-0 
while i<n: 
x =pickle. load (f) 
print x 
i=itl 


f.close() 


7.3.2 使 用 struct 模块 


struct 也 是 比较 常用 的 对 象 序列 化 和 二 进 制 文件 读 写 模块 ,下 面 通过 两 个 示例 来 简单 
介绍 使 用 struct 模块 对 二 进 制 文件 进行 读 写 的 用 法 。 
【 例 7-7】 使 用 struct 模块 写 人 二 进 制 文件 。 


import struct 

n = 1300000000 

x - 96.45 

b -True 

s-'alemg' 

sn -struct.pack('if?', n, x, b) HERR n、 浮 点 数 x\ 布 尔 对 象 b 依 次 转换 为 字 节 串 
f =open('sample struct.dat', 'wb') 

f.write (sn) FEACTS 

f.write(s) # 字 符 串 可 直接 写 人 
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f.close() 
[9/7-8) 使 用 struct 模块 读 取 例 7-7 写 入 二 进 制 文件 的 内 容 。 


import struct 

f -open('sample struct.dat', 'rb') 

sn =f.read(9) 

tu-struct.unpack('if?', sn) AFER sn 中 还 原 出 1 个 整数 .1 个 浮 点 数 和 1 个 布尔 值 ,并 返 
回 元 组 

print (tu) 

n -tu[0] 

x-tu[l] 

bl-tu[2] 

print 'n-',n 

print 'x-', x 

print 'bl-', bl 

s - f.read(9) 

f.close() 


print 's-', s 


7.4 文件 操作 


Python 提供 了 osos. path 和 shutil 等 大 量 模块 支持 文件 级 的 操作 。 其 中 os 模块 的 常 


用 文件 操作 方法 如 表 7-4 所 示 ,os. path 模块 的 常用 文件 操作 方法 如 表 7-5 所 示 。 


表 7-4 os 模块 的 常用 文件 操作 方法 


方 ”法 功能 说 明 
access(path mode) 按照 mode 指定 的 权限 访问 文件 
open(filename, flag[mode=0777]) 按照 mode 指定 的 权限 打开 文件 ,默认 权限 为 可 读 、 可 写 、 可 执行 
chmode() 改变 文件 的 访问 权限 
remove( path) 删除 指定 的 文件 
rename(srcydst) 重 命名 文件 或 目录 
stat path) 返回 文件 的 所 有 属性 
fstat(path) 返回 打开 的 文件 的 所 有 属性 
listdir(path) 返回 path 目录 下 的 文件 和 目录 列表 
getewd() 返回 当前 工作 目录 

表 7-5 os, path 模块 的 常用 文件 操作 方法 

方 法 功能 说 明 
abspath(path) 返回 绝对 路 径 
dirname(p) 返回 目录 的 路 径 
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方 ”法 功能 说 明 
exists(path) 判断 文件 是 否 存在 
getatime(filename) 返回 文件 的 最 后 访问 时 间 
getctime(filename) 返回 文件 的 创建 时 间 
getmtile(filename) 返回 文件 的 最 后 修改 时 间 
getsize(filename) 返回 文件 的 大 小 
isabs(path) ,isdir(path) ,isfile(path) | 判断 path 是 否 为 绝对 路 径 、 目 录 文件 
split(path) 对 路 径 进行 分 割 ,以 列表 形式 返回 
splitext( path) 从 路 径 中 分 割 文件 的 扩展 名 
splitdrive( path) 从 路 径 中 分 割 驱动 器 的 名 称 
walk(top,func,arg) 遍历 目录 


下 面 通 过 几 个 示例 来 演示 os 和 os. path 模块 的 用 法 。 


>>> import os 

>>> import os.path 
»»»0s.path.exists('testl.txt') 

False 

>>>os.rename('C:\\testl.txt', 'D:\\test2.txt') # 此 时 '"Cc:\\testl.txt' 不 存在 
出 错 信息 

>>>os.rename ('C:\\dfg.txt"', 'D:\\test2.txt') # os.rename () 可 以 实现 文件 的 改名 和 移动 
>>>os.path.exists ('C:\\dfg.txt') 

False 

>>>os.path.exists ('D:\\dfg.txt') 

False 

>>> os.path.exists ("D:\\test2.txt') 

True 

>>> path= 'D:\\mypython_exp\\new_test.txt' 
>>> os.path.dirname (path) 
"D:\\mypython_exp' 

>>> os.path. split (path) 
("D:\\mypython_exp', 'new test.txt') 
»»»0s.path.splitdrive (path) 

('D:', '\\mypython_exp\\new_test.txt') 
»»»08.path.splitext (path) 
("D:\\mypython_exp\\new_test', '.txt') 


下 面 的 代码 可 以 列 出 当前 目录 下 所 有 扩展 名 为 pye 的 文件 ,其 中 用 到 了 列表 推导 式 ,可 
以 翻阅 前 面 的 2. 1. 8 节 了 解 相关 知识 。 


>>> import os 
»»»print [fname for fname in os.listdir (os.getcwd ()) if os.path.isfile (fname) and fname. 
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endswith('.pyc')] 


['consts.pyc', 'database demo.pyc', 'nqueens.pyc'] 


下 面 的 代码 用 来 将 当前 目录 的 所 有 扩展 名 为 html 的 文件 修改 为 扩展 名 为 htm 的 


文件 。 


import os 
file list =os.listdir(".") 
for filename in file list: 
pos = filename.rindex(".") 
if filename [pos+1:] == "html": 
newname — filename [:post1]* "htm" 
os.rename (filename, newname) 


print (filename+ "更 名 为 : "+newname) 


shutil 模块 也 提供 了 大 量 的 方法 支持 文件 操作 ,详细 的 方法 列表 可 以 使 用 dir(shutil) 进 


行 查看 。 


»»»import shutil 

>>> dir (shutil) 

['Error', 'ExecError', 'ReadError', 'RegistryError', 'SameFileError', 
'SpecialFileError', ' ARCHIVE FORMATS', ' BZ2 SUPPORTED', ' UNPACK FORMATS', 
a all '," builtins ',' cached ',' doc ',' file ','' loader ', 


' name ',' package ','' spec ', ' basename', ' call external zip', 


' check unpack options', ' copyxattr', ' destinsrc', ' ensure directory', 

' find unpack format', ' get gid', ' get uid', ' make tarball', ' make zipfile', 
' ntuple diskusage', ' rmtree safe fd', ' rmtree unsafe', ' samefile', ' unpack 
tarfile', ' unpack zipfile', ' use fd functions', 'abspath', 'chown', 'collections', 
'copy', 'copy2', 'copyfile', 'copyfileobj', 'copymode', 'copystat', 'copytree', 
'disk usage', 'errno', 'fnmatch', 'get archive formats', 'get terminal size', 
'get unpack formats', 'getgrnam', 'getpwnam', 'ignore patterns', 'make archive', 
'move', 'nt', 'os', 'register archive format', 'register unpack format', 
'mtree', 'stat', 'sys', 'tarfile', 'unpack archive', 'unregister archive fonmat', 
'unregister unpack format', 'which'] 


例如 ,下 面 的 代码 使 用 该 模块 的 copyfile() 方 法 复制 文件 。 


>>> import shutil 
>>> shutil.copyfile('C:\\dir.txt', 'C:\\dirl.txt') 


7.5 目录 操作 


除了 支持 文件 操作 ,os 和 os. path 模块 还 提供 了 大 量 的 目录 操作 方法 ,os 模块 常用 的 


目录 操作 方法 如 表 7-6 所 示 , 可 以 通过 dir(os. path) 查 看 os. path 模块 关于 目录 操作 的 
方法 。 
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表 7-6 os 模块 常用 的 目录 操作 方法 


BE ERE: 


3 法 功能 说 明 
mkdir(path[ ,mode 一 0777]) 创建 目录 
makedirs( path1 / path2-** mode—511) 创建 多 级 目录 
rmdir( path) 删除 目录 
removedirs(pathl/path2*…) 删除 多 级 目录 
listdirCpath) 返回 指定 目录 下 的 文件 和 目录 信息 
getcwd() 返回 当前 工作 目录 
chdir( path) 把 path 设 为 当前 工作 目录 
walk(top, topdown= True, onerror= None) 遍历 目录 树 , 该 方法 返回 一 个 元 组 ,包括 3 个 元 素 : 所 有 
路 径 名 .所 有 目录 列表 与 文件 列表 


下 面 的 代码 演示 了 如 何 使 用 os 模块 的 方法 来 查看 改变 当前 工作 目录 ,以 及 创建 与 删 
除 目 录 。 


>>> import os 

»»»0s.getcwd() 

"C:\\Python27' 

>>> os.mkdir (os.getcwd()+ '\\temp") 
>>> os.chdir (os.getcwd()+ '\\temp') 
>>> os.getcwd() 
"C:\\Python27\\temp' 

>>> os.mkdir (os.getcwd()* '\\test') 
>>>os.listdir('.") 

['test'] 

»»»0s.rmdir('test') 
>>>os.listdir('.") 

$] 


如 果 需 要 遍历 指定 目录 下 的 所 有 子 目 录 和 文件 ,可 以 使 用 递归 的 方法 ,代码 如 下 : 


import os 
def visitDir (path): 
if not os.path.isdir (path): 
print 'Error:"',path, '" is not a directory or does not exist." 
return 
for lists in os.listdir(path): 
sub path =os.path.join (path, lists) 
print sub path 
if os.path.isdir(sub path): 
visitDir(sub path) 
visitDir('E:Wtest') 


下 面 的 代码 则 使 用 os 模块 的 walk() 方 法 进行 指定 目录 的 遍历 。 


import os 
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def visitDir2 (path): 
if not os.path.isdir (path) : 
print 'Error:"',path,'" 
return 
list dirs =os.walk (path) 
for root, dirs, files in list dirs: 
for din dirs: 
print os.path.join (root, d) 
for f in files: 
print os.path.join (root, f) 


visitDir2 ('H:\\music') 


is not a directory or does not exist." 


# 遍 历 该 元 组 的 目录 和 文件 信息 


# 获 取 完 整 路 径 


# 获 取 文 件 绝对 路 径 


也 可 以 使 用 os. path 模块 的 walk() 方 法 遍历 目录 ,代码 如 下 : 


def visitDir3 (arg,dirname, names) : 
for filepath in names: 
print os.path.join (dirname, filepath) 
os.path.walk ('H:\\music',visitDir3, ()) 


7.6 高 级 话题 


在 本 章 最 后 ,我 们 一 起 来 看 几 个 稍微 高 级 一 点 的 话题 ,包括 计算 文件 MD5 值 、 判 断 文 
件 类 型 和 Excel 文件 读 写 等 。 


COD 计算 CRC32 值 。 下 面 的 代码 分 别 使 用 zlib 和 binascii 模块 的 方法 来 计算 人 


串 的 CRC32 值 ,该 代码 经 过 简单 修改 , 即 可 用 来 计算 文件 的 CRC32 值 ,相信 读者 可 以 做 到 
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>>> import zlib 

>>>print zlib.crc32('1234') 
- 1679564637 

>>>print zlib.crc32('111') 
1298878781 

>>>print zlib.crc32('SDIBT') 
2095416137 

>>> import binascii 
»»»binascii.crc32('SDIBT') 


2095416137 


(2) 计算 文本 文件 中 最 长 行 的 长 度 。 
方法 一 : 


f=open('D:\\test.txt', 'r') 

allLinelens = [len (line.strip()) for line in f] 
£.close() 

longest —max (allLineLens) 

print longest 
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方法 二 : 


f -open('D:Wtest.txt','r') 

longest —max(len(line.strip()) for line in f) 
£.close() 

print longest 


当然 ,为 了 实现 这 个 功能 ,还 有 很 多 别 的 写法 ,您 不 妨 大 胆 尝 试 一 下 ,争取 写 出 更 加 简 
洁 、 更 加 优雅 与 更 加 Pythonic 的 代码 。 

(3) 计算 字符 串 MDS fi. MDS 值 可 以 用 来 判断 文件 发 布 之 后 是 否 被 自 改 ,对 于 文件 
完整 性 保护 具有 重要 意义 。 


>>> import hashlib 

>>> import md5 
>>>md5value=hashlib.md5 () 
»»»md5value.update('12345') 
»»»md5value-md5value.hexdigest () 
»»»print md5value 
827ccb0eea8a706c4c34a16891£84e7b 
»»»md5value- md5.md5() 
»»»md5value.update ('12345') 
»»»md5value- md5value.hexdigest () 
>>>print md5value 
827ccb0eea8a706c4c34a16891£84e7b 


上 面 的 代码 稍 加 改造 , 即 可 实现 自己 的 MD5 计算 器 ,例如 : 


import hashlib 
import os 
import sys 


fileName = sys.argv[l] 
if os.path.isfile (fileName) : 
with open (fileName, 'r') as fp: 
lines =fp.readlines () 
data =''.join(lines) 


print hashlib.md5 (data) .hexdigest () 


将 上 面 的 代码 保存 为 文件 CheckMD5OfFile. py. 
然后 计算 某 文件 的 MD5 值 , 对 该 文件 进行 微小 修改 
后 再 次 计算 其 MD5 值 ,可 以 发 现 ,哪怕 只 是 修改 了 
点 点 内 容 , MD5 值 的 变换 也 是 非常 大 的 , 如 
图 7-1 所 示 。 

另外 ,也 可 以 使 用 ssdeep 工具 来 计算 文件 的 模 
糊 哈 希 值 或 分 段 哈 希 值 ,或 者 编写 Python 程序 调 
ssdeep 提供 的 API 函数 来 计算 文件 的 模糊 哈 希 值 ， 图 7-1 计算 文件 MD5 值 
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模糊 哈 希 值 可 以 用 来 比较 两 个 文件 的 相似 百分比 。 


>>> from ssdeep import ssdeep 
>>>s =ssdeep() 


»»»print s.hash file(filename) 


对 于 某 些 恶意 软件 来 说 ,可 能 会 对 自身 进行 加 壳 或 加 密 , 真 正 运行 时 再 进行 脱 壳 或 解 
密 , 这 样 一 来 ,磁盘 文件 的 哈 希 值 和 内 存 中 脱 壳 或 解密 后 进程 的 哈 希 值 相差 很 大 。 因 此 , 根 
据 磁 盘 文 件 和 其 相应 的 进程 之 间 模 糊 喻 希 值 的 相似 度 可 以 判断 该 文件 是 否 包含 自修 改 代 
码 , 并 以 此 来 判断 其 为 恶意 软件 的 可 能 性 。 

(A) 判断 一 个 文件 是 否 为 GIF 图 像 文 件 。 任 何 一 种 文件 都 具有 专门 的 文件 头 结构 ,在 
文件 头 中 存放 了 大 量 的 信息 ,其 中 就 包括 该 文件 的 类 型 。 通 过 文件 头 信息 来 判断 文件 类 型 
的 方法 可 以 得 到 更 加 准确 的 信息 ,而 不 依赖 于 文件 扩展 名 。 


def is gif (fname): 
f-open (fname, 'r') 
first4-tuple(f.read(4)) 
print first4 
f.close() 
return first4-- ('G','I', 'F','8") 
»»»is gif('C:Wtest.gif') 
('6*, "I", 'F', '8") 
True 
>>> is_gif('C:\\dir.txt') 


False 


(5) 比较 两 个 文本 文件 是 否 相 同 。 这 里 使 用 到 difflib 模块 的 SequenceMatcher() 方 法 ， 
检测 结果 相对 还 算 清 晰 ,请 大 家 运行 下 面 的 代码 并 查看 结果 。 


import difflib 
A=file('C:\\dir.txt','r') 
B-file('C:Wdirl.txt','r') 
contextA =A.read() 
contextB =B.read() 
s =difflib.SequenceMatcher (lambda x:x=="", contextA, contextB) 
result =s.get_opcodes () 
for tag, il,i2,j1,j2 in result: 

print ("$s contextA[%d:%d]=%s contextB[%d:%d]=%s"3\ 

(tag, il,i2, contextA [il:i2],j1,j2, contextB[j1:j2])) 


(6) 使 用 xlwt BRE A Excel 文件 。xlwt 模块 默认 没有 安装 ,可 以 使 用 pip 进行 安装 。 


from xlwt import * 
book =Workbook () 
sheet1 =book.add_sheet ("First") 


al-Alignment () 
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al.horz-Alignment.HORZ CENTER HIRTA 
al.vert-Alignment.VERT CENTER 

borders- Borders () 

borders.bottom-Borders.THICK # 边 框 样 式 
style-XFStyle () 


style.alignment- al 
style.borders-borders 

row0= sheetl.row(0) 

row0.write (0, 'test',style-style) 
book. save (r'D:\test.xls') 


(7) 使 用 xlrd 模块 读 取 Excel 文件 ,与 xlwt 模块 一 样 ,xlrd 模块 也 需要 单独 安装 。 


>>> import xlrd 

>>> book -xlrd.open workbook (r'D:Ntest.xls') 
>>> sheet =book.sheet_by name('First') 

>>> row0 —sheetl.row (0) 

>>>print row0[0] 

text:u'test' 

>>>print row0[0].value 

test 


(8) 使 用 pywin32 操作 Excel 文件 。pywin32 模块 需要 单独 安装 ,这 是 一 个 功能 非常 强 
大 的 模块 ,提供 了 Windows 底层 API 函数 的 封装 ,使 得 可 以 在 Python 中 直接 调用 
Windows API 函数 ,支持 大 量 的 Windows 底层 操作 ,后 面 章节 还 会 用 到 该 模块 的 其 他 
功能 。 


xlApp -win32com.client.Dispatch('Excel.Application') # 打 开 Excel 
xlBook = xlApp.Workbooks.Open('D:\\1.xls') 

xlSht -xlBook.Worksheets ('sheetl') 

aaa —xlSht.Cells(1,2).Value 

xlSht.Cells(2,3).Value =aaa 

x1Book.Close (SaveChanges- 1) 

del xlapp 


本 章 知 识 精 要 
CD. 文件 操作 在 各 类 软件 开发 中 均 占有 重要 的 地 位 。 
(2) 文件 对 象 的 读 、 写 方法 都 会 自动 改变 文件 指针 的 位 置 。 
(3) Python 2. x 和 Python 3. x 对 文件 对 象 的 读 、 写 方法 解释 略 有 不 同 。 


(4) os 和 os. path 模块 提供 了 大 量 用 于 文件 和 文件 夹 操作 的 方法 ,包括 文件 和 文件 夹 
的 移动 .复制 ,删除 和 重 命名 等 。 
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1. 假设 有 一 个 英文 文本 文件 ,编写 程序 读 取 其 内 容 , 并 将 其 中 的 大 写字 母 变 为 小 写字 
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母 ,小 写字 母 变 为 大 写字 母 。 
2. 编写 程序 ,将 包含 学 生成 绩 的 字典 保存 为 二 进 制 文件 ,然后 再 读 取 内 容 并 显示 。 
3. 使 用 shutil 模块 中 的 move() 方 法 进行 文件 移动 。 
4. 简单 解释 文本 文件 与 二 进 制 文件 的 区 别 。 
5. 编写 代码 ,将 当前 工作 目录 修改 为 “C:\”, 并 验证 ,最 后 将 当前 工作 目录 恢复 为 原来 


的 目录 。 
6. 编写 程序 ,用 户 输入 一 个 目录 和 一 个 文件 名 ,搜索 该 目录 及 其 子 目录 中 是 否 存 在 该 
xit. 
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第 8 章 异常 处 理 结构 与 程序 调试 


几乎 每 种 高 级 编程 语言 都 提供 了 异常 处 理 结构 。 简 单 地 说 ,异常 是 指 程序 运行 时 引发 
的 错误 ,引发 错误 的 原因 有 很 多 ,如 除 零 .下 标 越界 ,文件 不 存在 和 网 络 异 常 等 。 如 果 这 些 错 
误 得 不 到 正确 的 处 理 将 会 导致 程序 终止 运行 ,而 合理 地 使 用 异常 处 理 结果 可 以 使 得 程序 更 
加 健壮 ,具有 更 高 的 容错 性 ,不 会 因为 用 户 不 小 心 的 错误 输入 而 造成 程序 终止 。 或 者 ,也 可 
以 使 用 异常 处 理 结构 给 用 户 更 加 友好 的 提示 。 程 序 出 现 异 常 后 能 够 调试 程序 并 快速 定位 和 
解决 存在 的 问题 是 程序 员 综合 水 平和 能 力 的 重要 体现 。 本 音 首 先 介 绍 Python 异常 以 及 异 
常 处 理 结构 ,然后 介绍 几 种 不 同 的 Python 程序 调试 技术 。 


8.1 基本 概念 


什么 是 异常 呢 ? 让 我 们 先 来 看 个 示例 。 


>>>x, y=10, 5 

»»a-x/y 

»»»print A # 拼 写 错误 ,Python 对 变量 名 等 标识 符 的 大 小 写 敏感 
Traceback (most recent call last): 

File "<pyshell#2>", line 1, in « module» 


print A 
NameError: name 'A' is not defined 
>>>10 * (1/0) # 除 0 错误 


Traceback (most recent call last): 
File "<stdin>", line 1, in? 
ZeroDivisionError: division by zero 
>>>4 *spam* 3 # 使 用 了 未 定义 的 变量 ,与 拼写 错误 的 情形 相似 
Traceback (most recent call last): 
File "<stdin>", line 1, in? 
NameError: name 'spam' is not defined 
>>>'2" +2 # 对象 类 型 不 支持 特定 的 操作 
Traceback (most recent call last): 
File "«stdin»", line 1, in ? 
TypeError: Can't convert 'int' object to str implicitly 
在 前 面 的 章节 中 ,您 肯定 已 经 注意 到 过 类 似 的 信息 , 没 错 ,这 就 是 Python 异常 的 标准 
表现 形式 。 熟 练 运 用 异常 处 理 机 制 对 于 提高 程序 的 健壮 性 和 容错 性 具有 重要 的 作用 ,同时 
也 可 以 把 Python 星 梁 难 懂 的 错误 提示 转换 为 友好 的 提示 显示 给 最 终 用 户 。 
异常 处 理 是 指 因 为 程序 执行 过 程 中 出 错 而 在 正常 控制 流 之 外 采取 的 行为 。 严 格 地 说 ， 
语法 错误 和 逻辑 错误 不 属于 异常 ,但 有 些 语 法 错误 往往 会 导致 异常 。 例 如 ,由 于 大 小 写 拼写 
错误 而 试图 访问 不 存在 的 对 象 ,或 者 试图 访问 不 存在 的 文件 等 。 当 Python 检测 到 一 个 错 
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误 时 ,解释 器 就 会 指出 当前 程序 流 已 无 法 继续 执行 下 去 ,这 时 候 就 出 现 了 异常 。 当 程序 执行 
过 程 中 出 现 错误 时 Python 会 自动 引发 异常 ,程序 员 也 可 以 通过 raise 语句 显 式 地 引发 异常 。 

需要 注意 的 是 ,尽管 异常 处 理 机 制 非常 重要 也 非常 有 效 , 但 是 不 建议 使 用 异常 来 代替 常 
规 的 检查 。 例 如 必要 的 if…else 判断 等 。 在 编程 时 应 避免 过 多 依赖 于 异常 处 理 机 制 来 提高 
程序 的 健壮 性 。 


8.2 Python 异常 类 与 自 定义 异常 


下 面 的 图 较为 全 面 地 展示 了 Python 内 建 异常 类 的 继承 层次 。 


BaseException 
*--SystemExit 
*--KeyboardInterrupt 
*--GeneratorExit 
*--Exception 

*--StopIteration 

*--ArithmeticError 

l +--FloatingPointError 

1 *--OverflowError 

1 *--ZeroDivisionError 

*--AssertionError 

*--AttributeError 

*--BufferError 

+--EOFError 

*--ImportError 

*--LookupError 

1 *--IndexError 

l *--KeyError 

*--MemoryError 

*--NameError 

1 * --UnboundLocalError 

*--OSError 

I *- -BlockingIOError 
*--ChildProcessError 
*--ConnectionError 
| *--BrokenPipeError 
| +--ConnectionAbortedError 
1 * - ConnectionRefusedError 
| *--ConnectionResetError 
*--FileExistsError 
*--FileNotFoundError 
*--InterruptedError 


*--IsADirectoryError 
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l *--NotADirectoryError 
1 *--PermissionError 
1 *-- ProcessLookupError 
1 +--TimeoutError 
*--ReferenceError 
*--RuntimeError 
| + 一 -NotImplementedError 
*--SyntaxError 
1 *--IndentationError 
1 *--TabError 
*--SystemError 
*--TypeError 
*--ValueError 
1 * --UnicodeError 
1 +- -UnicodeDecodeError 
1 * - -UnicodeEncodeError 
1 * --UnicodeTranslateError 
*--Warning 
*- -DeprecationWarning 
+- - PendingDeprecationWarning 
*--RuntimeWarning 
*--SyntaxWarning 
*--UserWarning 
*--FutureWarning 
*--ImportWarning 
+- -UnicodeWarning 
*- -BytesWarning 


+- -ResourceWarning 
如 果 需 要 的 话 ,也 可 以 继承 Python 内 置 异常 类 来 实现 自 定义 的 异常 类 ,例如 : 


class ShortInputException (Exception): 
"您 定义 的 异常 类 。" 
def init (self, length, atleast): 
Exception. init (self) 
self.length = length 
self.atleast =atleast 
try: 
s =raw_input (' 请 输入 -->') 
if len(s) <3: 
raise ShortInputException (len (s), 3) 
except EOFError: 
print ' 您 输入 了 一 个 结束 标记 EOF" 
except ShortInputException, x: 
print 'ShortInputException: 输入 的 长 度 是 sa, 长 度 至 少 应 是 td" %(x.length, x.atleast) 
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else: 


print ' 没 有 异常 发 生 ." 
再 如 下 面 的 示例 : 


>>> class MyError (Exception): 
def init (self, value): 
self.value =value 
def str (self): 
return repr (self.value) 
>>> try: 
raise MyError (2* 2) 
except MyError as e: 
print ('My exception occurred, value:', e.value) 
My exception occurred, value: 4 
>>> raise MyError ('oops!') 
Traceback (most recent call last): 
File "<stdin>", line 1, in ? 


. main .MyError: 'oops!" 


如 果 自 己 编写 的 某 个 模块 需要 抛 出 多 个 不 同 但 相关 的 异常 ,可 以 先 创建 一 个 基 类 ,然后 
创建 多 个 派生 类 分 别 表 示 不 同 的 异常 。 


class Error (Exception): # 创 建 基 类 
pass 
class InputError (Error): # 派 生 类 InputError 


"""Exception raised for errors in the input. 
Attributes: 
expression -- input expression in which the error occurred message -- 
explanation of the error 
"nn 
def init (self, expression, message): 
self.expression =expression 
self.message =message 
class TransitionError (Error): # 派 生 类 TransitionError 
"""Raised when an operation attempts a state transition that's not allowed. 
Attributes: 
previous - - state at beginning of transition 
next - -attempted new state 
message -- explanation of why the specific transition is not allowed 
def init (self, previous, next, message): 
self.previous =previous 
self.next —next 


self .message —message 
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8.3 Python 中 的 异常 处 理 结构 


异常 处 理 结构 中 最 常见 也 是 最 基本 的 结构 应 该 是 try…except… 结 构 。 其 中 try 子 句 中 
的 代码 块 包 含 可 能 出 现 异常 的 语句 ,而 except 子 句 用 来 捕捉 相应 的 异常 ,except 子 句 中 的 
代码 块 则 用 来 处 理 异 常 。 如 果 try 中 的 代码 块 没有 出 现 异 常 则 继续 往 下 执行 异常 处 理 结构 
后 面 的 代码 ;如 果 出 现 异常 并 且 被 except 子 句 捕获 则 执行 except 子 句 中 的 异常 处 理 代码 ; 
如 果 出 现 异常 但 没有 被 except 捕获 , 则 继续 往外 层 抛 出 ;如 果 所 有 层 都 没有 捕获 并 处 理 该 
异常 , 则 程序 终止 并 将 该 异常 抛 给 最 终 用户 。 该 结构 语法 如 下 : 


try: 

try 块 # 被 监控 的 语句 ,可 能 会 引发 异常 
except Exception[, reason]: 

except 块 # 处 理 异 常 的 代码 


如 果 需 要 捕获 所 有 异常 ,可 以 使 用 BaseException, 即 Python 异常 类 的 基 类 ,代码 格式 
WF: 


try: 


except BaseException, e: 
except He # 处 理 所 有 错误 

上 面 的 结构 可 以 捕获 所 有 异常 ,尽管 这 样 做 很 安全 ,但 是 一 般 并 不 建议 这 样 做 。 对 于 异 
常 处 理 结构 ,一般 的 建议 是 尽量 显 式 捕捉 可 能 会 出 现 的 异常 并 且 有 针对 性 地 编写 代码 进行 
处 理 , 因 为 在 实际 应 用 开发 中 ,很 难 使 用 同一 段 代码 去 处 理 所 有 类 型 的 异常 。 当 然 ,为 了 避 
免 遗 漏 没有 得 到 处 理 的 异常 干扰 程序 的 正常 执行 ,在 捕捉 了 所 有 可 能 想到 的 异常 之 后 ,也 可 
以 使 用 异常 处 理 结 构 的 最 后 一 个 except 来 捕捉 BaseException, 

下 面 的 代码 演示 了 try…except… 结 构 的 用 法 ,代码 运行 后 提示 用 户 输入 内 容 , 如 果 输 
和 的 是 数字 则 循环 结束 ,否则 一 直 提 示 用 户 输入 正确 格式 的 内 容 。 


>>>while True: 
try: 
X =int (input ("Please input a number: ")) 
break 
except ValueError: 
print ("That was no a valid number. Try again") 


在 使 用 时 ,except 子 句 可 以 在 异常 类 名 字 后 面 指定 一 个 变量 ,用 来 捕获 异常 的 参数 或 更 
详细 的 信息 。 


>>>try: 
raise Exception ('spam', 'eggs') 
except Exception as inst: 
print (type (inst)) # the exception instance 
print (inst .args) #arguments stored in .args 
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Print (inst) # str allows args to be printed directly, 
#but may be overridden in exception subclasses 

x, y=inst.args # unpack args 

print('x-', x) 


print('y -', y) 


«class 'Exception'» 
(‘spam', 'eggs') 
(‘spam', 'eggs') 
x =spam 
y =eggs 
另外 一 种 常用 的 异常 处 理 结构 是 try…except…else… 语 句 。 正 如 前 面 童 节 中 已 经 提 到 
过 ,这 也 是 一 种 特殊 形式 的 选择 结构 。 如 果 try 中 的 代码 抛 出 了 异常 ,并 且 被 某 个 except dili 
提 则 执行 相应 的 异常 处 理 代 码 , 这 种 情况 下 不 会 执行 else 中 的 代码 ;如 果 try 中 的 代码 没有 
抛 出 异常 , 则 执行 else 块 。 例 如 下 面 的 代码 : 
a list =['China', 'America', 'England', 'France'] 
print "请 输入 字符 串 的 序号 ' 
while True: 
n -input() 
try: 
print a list[n] 
except IndexError: 


print "列表 元 素 的 下 标 越界 或 格式 不 正确 ,请 重新 输入 字符 串 的 序号 ' 
else: 
break 


在 实际 开发 中 ,同一 段 代码 可 能 会 抛 出 多 个 异常 ,需要 针对 不 同 的 异常 类 型 进行 相应 的 
处 理 。 为 了 支持 多 个 异常 的 捕捉 和 处 理 ,Python 提供 了 带 有 多 个 except 的 异常 处 理 结构 ， 
这 类 似 于 多 分 支 选择 结构 。 一 旦 某 个 except 捕获 了 异常 , 则 后 面 剩余 的 except 子 句 将 不 会 
再 执行 。 该 结构 的 语法 如 下 : 


try: 

try 块 # 被 监控 的 语句 
except Exceptionl: 

except Hk 1 # 处理 异常 1 的 语句 
except Exception2: 

except 块 2 # 处 理 异 常 2 的 语句 


下 面 的 代码 演示 了 该 结构 的 用 法 : 


try: 
zx=input (' 请 输入 被 除数 :') 
天 input(" 请 输入 除数 : n) 
z-float(x) / y 


except ZeroDivisionError: 


— — — 148 


异常 处 理 结构 与 程序 调试 


print "除数 不 能 为 零 ' 
except TypeError: 

print "被 除数 和 除数 应 为 数值 类 型 ' 
except NameError: 

print ' 变 量 不 存在 ' 
else: 


print x, '/', y, "=", Z 
将 要 捕获 的 异常 写 在 一 个 元 组 中 ,可 以 使 用 一 个 except 语句 捕获 多 个 异常 ,并 且 共 用 
同一 段 异常 处 理 代码 ,当然 ,除非 确定 要 捕获 的 多 个 异常 可 以 使 用 同一 段 代码 来 处 理 ,否则 
并 不 建议 这 样 做 。 


import sys 
try: 
f -open('myfile.txt') 
s =f.readline() 
i-int(s.strip()) 
except (OSError, ValueError,RuntimeError, NameError): 
pass 
最 后 一 种 常用 的 异常 处 理 结构 是 try…except…finally… 结 构 。 在 该 结构 中 finally F 
句 中 的 内 容 无 论 是 否 发 生 异常 都 会 执行 ,常用 来 做 一 些 清理 工作 以 释放 try 子 句 中 申请 的 
资源 。 语 法 如 下 : 


try: 


finally: 
# 无 论 如 何 都 会 执行 的 代码 


例如 下 面 的 代码 ,无论 是 否 发 生 异 常 , 语 句 print(5) 都 会 被 执行 。 


>>>try: 
3/0 
except: 
print (3) 
finally: 
print (5) 
3 
5 


再 如 下 面 的 代码 ,无论 读 取 文件 是 否 发 生 异 常 , 总 是 能 够 保证 正常 关闭 该 文件 。 


try: 
f -open('test.txt', 'r') 
line -f.readline () 
print line 

finally: 
£.close() 
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需要 注意 的 一 个 问题 是 ,如 果 try 子 句 中 的 异常 没有 被 捕 提 和 处 理 , 或 者 except 子 句 或 
else 子 句 中 的 代码 出 现 了 异常 ,那么 这 些 异常 将 会 在 finally 子 句 执行 完 后 再 次 抛 出 。 例 如 
上 面 的 代码 ,使 用 异常 处 理 结构 的 本 意 是 为 了 防止 文件 读 取 操 作出 现 异 常 而 导致 文件 不 能 
正常 关闭 ,但 是 如 果 因 为 文件 不 存在 而 导致 文件 对 象 创建 失败 ,那么 finally 子 句 中 关闭 文 
件 对 象 的 代码 将 会 抛 出 异常 从 而 导致 程序 终止 运行 。 


»»»try: 
f -open('test.txt', 'r') 
line =£.readline() 
print line 

finally: 
f.close() 

Traceback (most recent call last): 

File "<pyshell# 17>", line 6, in «module» 

f.close() 

NameError: name 'f' is not defined 


再 如 下 面 的 代码 ,在 try 中 的 语句 出 现 了 异常 但 是 没有 得 到 处 理 ,因此 ,finally 中 的 语 
句 执 行 完 以 后 再 次 抛 出 该 异常 。 


>>>try: 
3/0 
finally: 
print (5) 
5 
Traceback (most recent call last): 
File "«pyshell£ 52>", line 1, in «module» 
try:3/0 
finally: 
print (5) 


ZeroDivisionError: division by zero 
下 面 的 代码 较为 完整 地 演示 了 这 种 情况 。 


>>>def divide(x, y): 
try: 
result =x / y 
except ZeroDivisionError: 
print ("division by zero!") 
else: 
print ("result is", result) 
finally: 
print ("executing finally clause") 
»»»divide(2, 1) 
result is 2.0 
executing finally clause 


»»»divide(2, 0) 
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division by zero! 
executing finally clause 
»»»divide("2", "1") 
executing finally clause 
Traceback (most recent call last): 
File "<stdin>", line 1, in ? 
File "«stdin»", line 3, in divide 


TypeError: unsupported operand type(s) for /: 'str' and 'str' 


使 用 带 有 finally 子 句 的 异常 处 理 结构 时 ,应 尽量 避免 在 finally 子 句 中 使 用 return if 
名 ,和 否则 可 能 会 出 现 出 乎 意料 的 错误 。 例 如 下 面 的 代码 : 


>>>def demo div (a,b): 
try: 
return a/b 
except: 
pass 
finally: 
return -1 
»»»demo div(1,0) 
=r 
>>>demo div(1,2) 
=1 
>>>demo div (10,2) 
=a 
通过 本 节 介 绍 , 相 信和 您 已 经 了 解 和 掌握 了 Python 异常 处 理 结构 的 原理 和 用 法 。 简 单 
总 结 一 下 ,可 以 理解 为 “请 求 原谅 比 请 求 允许 要 容易 ”。 也 就 是 说 ,有 些 代码 执行 可 能 会 出 现 
错误 ,也 可 能 不 会 出 现 错误 ,这 主要 由 运行 时 的 各 种 客观 因素 决定 ,此 时 建议 使 用 异常 处 理 
结构 。 如 果 使 用 大 量 的 选择 结构 来 提前 判断 , 仅 当 满足 相应 条 件 时 才 执 行 该 代码 ,这 些 条 件 
判断 可 能 会 严重 干扰 正常 的 业务 逻辑 ,也 会 严重 降低 代码 的 可 读 性 。 


8.4 断言 与 上 下 文 管理 


断言 与 上 下 文 管理 可 以 说 是 两 种 比较 特殊 的 异常 处 理 方式 ,在 形式 上 比 异 常 处 理 结构 要 
简单 一 些 , 能 够 满足 简单 的 异常 处 理 或 条 件 确认 ,并 且 可 以 与 标准 的 异常 处 理 结构 结合 使 用 。 


8.4.1 断言 
断言 语句 的 语法 如 下 : 


assert expression[, reason] 


当 判 断 表达 式 expression 的 值 为 真 时 ,什么 都 不 做 ;如 果 表 达 式 的 值 为 假 , 则 抛 出 异常 。 
assert 语句 一 般 用 于 对 程序 某 个 时 刻 必须 满足 的 条 件 进行 验证 , 仅 当 _debug_ 为 True 
时 有 效 。 当 Python 脚本 以 -O 选项 编译 为 字 节 码 文件 时 ,assert 语句 将 被 移 除 以 提高 运行 


151 


《Python 程序 设计 》 


断言 和 异常 处 理 结构 经 常 结合 使 用 ,例如 : 


>>>try: 
assert 1 ==2 , "lis not equal 2!" 
except AssertionError, reason: 
print "$s:%s"% (reason. class . name , reason) 


AssertionError: 1 is not equal 2! 
8.4.2 上 下 文 管理 


使 用 上 下 文 管理 语句 with 可 以 自动 管理 资源 ,在 代码 块 执行 完毕 后 自动 还 原 进入 该 代 
码 块 之 前 的 现场 或 上 下 文 。 不 论 何 种 原因 跳出 with 块 ,也 不 论 是 否 发 生 异 常 ,总 能 保证 资 
源 被 正确 释放 ,这 大 大 简化 了 程序 员 的 工作 ,常用 于 文件 操作 、 网 络 通信 之 类 的 场合 。 

with 语句 的 语法 如 下 : 


with context expr [as var]: 
with 块 


例如 ,下 面 的 代码 演示 了 文件 操作 时 with 语句 的 用 法 ,使 用 这 样 的 写法 程序 员 丝毫 不 
用 担心 忘记 关闭 文件 , 当 文件 处 理 完 以 后 ,将 会 自动 关闭 。 
with open('D:\\test.txt') as f: 
for line in f: 


print line 


8.5 ”用 sys 模块 回溯 最 后 的 异常 


当 发 生 异 常 时 ,Python 会 回溯 异常 ,给 出 大 量 的 提示 ,可 能 会 给 程序 员 的 定位 和 纠 错 带 
来 一 定 的 困难 ,这 时 可 以 使 用 sys 模块 来 回溯 最 后 的 异常 。 语 法 为 


import sys 
try: 
block 
except: 
t-sys.exc info() 
print t 
sys. exc_info() 的 返回 值 是 一 个 三 元 组 (type, value/message, traceback), Hi rf type 
表示 异常 的 类 型 ,value/message 表示 异常 的 信息 或 者 参数 ,而 traceback 则 包含 调用 栈 信 息 
的 对 象 。 
例如 ,下 面 的 代码 演示 了 其 用 法 : 
>>>1/0 
Traceback (most recent call last) : 


File "<pyshell# 25>", line 1, in «module» 
1/0 
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ZeroDivisionError: integer division or modulo by zero>>> import sys 
»try: 
1/0 
except: 
r-sys.exc info() 
print(r) 
(«class 'ZeroDivisionError'>, ZeroDivisionError ('division by zero',), 


<traceback object at 0x000000000375C788» ) 


下 面 的 代码 演示 了 标准 的 异常 跟踪 和 sys. exc_info() 之 间 的 区 别 , 可 以 看 出 ,sys. exc 
info() 可 以 直接 定位 最 终 引发 异常 的 原因 ,结果 也 比较 简洁 ,但 是 缺点 是 难以 直接 确定 引发 
异常 的 代码 位 置 ; 


>>>def A(): 
1/0 
>>>def B(): 
A() 
>>>def C(): 
B() 
>>>C() 
Traceback (most recent call last): 
File "<pyshell# 35>", line 1, in <module> 
co 
File "<pyshell# 34>", line 2, inc 
Bi) 
File "<pyshell# 31>", line 2, inB 
A() 
File "<pyshell# 28>", line 2, inA 
1/0 
ZeroDivisionError: integer division or modulo by zero 
>>> try: 
co 
except: 
r-sys.exc info() 
print r 
(«type 'exceptions. ZeroDivisionError'>, ZeroDivisionError ('integer division or modulo by 


zero',), «traceback object at 0x0134C990> ) 


8.6 使 用 IDLE 调试 代码 


当 程 序 运行 发 生 错误 或 者 得 到 了 非 预期 的 结果 时 ,是 否 能 够 熟练 地 对 程序 进行 调试 以 
快速 定位 和 解决 问题 是 体现 程序 员 综合 能 力 的 重要 标准 之 一 。 

几乎 任何 一 种 集成 开发 环境 都 提供 了 代码 调试 功能 ,Python 也 不 例外 ,Python 标准 开 
发 环境 IDLE 就 提供 了 调试 功能 。 使 用 时 ,首先 通过 单 击 菜单 Debug Debugger 打开 调试 
器 窗口 ,然后 打开 并 运行 要 调试 的 程序 ,最 后 切换 到 调试 器 窗口 使 用 其 中 的 控制 按钮 进行 调 
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F Stack seeee 一 显示 当前 执行 的 代码 


[V Locals [V Globals. 


x 一 显示 所 有 全 部 变量 
:Yeoaale>0 
a 变量 


P 当前 执行 行内 容 
调试 的 文件 名 
以 及 正在 执行 
的 行 号 


None 
局 部 变量 


Globals 
_builtins_ (module builtin ' built-in)? 


ate 
package, None 


图 8-1 IDLE 调试 器 窗口 


8.7 使 用 pdb 模块 调试 程序 


pdb 是 Python 自 带 的 交互 式 源 代码 调试 模块 , 源 代码 文件 为 pdb. py, 感 兴趣 的 读者 可 
以 在 Python 安装 目录 下 找到 该 文件 进行 阅读 以 理解 其 工作 原理 。pdb 模块 需要 导入 后 才 
能 使 用 其 中 的 功能 ,使 用 该 模块 可 以 完成 代码 调试 的 绝 大 部 分 功能 ,包括 设置 /清除 (条 件 ) 
断 点 、 启 用 /禁用 断 点 、 单 步 执行 、 查 看 栈 帧 查看 变量 值 .查看 当前 执行 位 置 、 列 出 源 代码 、 执 
行 任意 Python 代码 或 表达 式 等 。pdb 还 支持 事后 调试 , 既 可 以 在 程序 控制 下 被 调用 ,也 可 
以 通过 pdb 和 cmd 接口 对 该 调试 器 进行 扩展 。pdb 模块 常用 调试 命令 如 表 8-1 所 示 。 

表 8-1 pdb 模块 常用 调试 命令 


简写 /完整 命令 用 法 示例 解 释 
a(rgs) 显示 当前 函数 中 的 参数 
b 173 在 173 行 设 置 断 点 
b function 在 function 函数 第 一 条 可 执行 语句 位 置 设置 断 点 
| 不 带 参数 则 列 出 所 有 断 点 ,包括 每 个 断 点 的 角 
fosctionl s epoditisa | 发 次 数 、 当 前 忽略 计数 ,以 及 与 之 关联 的 条 件 
b 175, condition 设置 条 件 断 点 , 仅 当 condition 的 值 为 True 时 该 
i 断 点 有 效 
cl 清除 所 有 断 点 
elke) Llane lion cl filename;lineno | 删除 指定 文件 指定 行 的 所 有 断 点 
bpnumber [bpnumber …]] 
cl359 删除 第 3.5.9 个 断 点 


154 


异常 处 理 结构 与 程序 调试 


续 表 
简写 /完整 命令 用 法 示例 解 释 
condition 3 a<b | 仅 当 a<b 时 3 号 断 点 有 效 
condition bpnumber [condition] 
condition 3 将 3 号 断 点 设置 为 无 条 件 断 点 
continue 继续 运行 至 下 一 个 断 点 或 脚本 结束 
disable [bpnumber [bpnumber *…]] | disable 3 5 禁用 第 3.5 个 断 点 ,禁用 后 断 点 仍 存在 ,可 以 再 
次 被 启用 
d(own) 在 栈 跟踪 器 中 向 下 移动 一 个 栈 帧 
enable [bpnumber [bpnumber …]] | enable n 启用 第 n 个 断 点 
hCelp) [command] 查看 pdb 帮助 
为 断 点 设置 忽略 计数 ,count 默认 值 为 0。 若 某 
ignore bpnumber [count] 断 点 的 忽略 计数 不 为 0, 则 每 次 触发 时 自动 减 
1, 当 忽略 计数 为 0 时 该 断 点 处 于 活动 状态 
jCump) j 20 跳 至 第 20 行 继续 运行 
1 列 出 脚本 清单 ,默认 为 11 行 
ICist) [first [,last]] lm,n 列 出 从 第 m 行 到 第 n 行 之 间 的 脚本 代码 


列 出 从 第 m 行 开始 的 11 行 代码 


n(ext) 执行 下 一 条 语句 ,过 到 函数 时 不 进入 其 内 部 

plrint) pi 打印 变量 i 的 值 

(uit) 退出 pdb 调试 环境 

rCeturn) 一 直 运 行 至 当前 函数 返回 

k 设置 临时 断 点 ,该 类 型 断 点 只 被 中 断 一 次 ,触发 
后 该 断 点 自动 删除 

step 执行 下 一 条 语句 , 遇 到 函数 时 进入 其 内 部 

u(p) 在 栈 跟 踪 器 中 向 上 移动 一 个 栈 帧 

where) 查看 当前 栈 帧 


L!]statement 


在 pdb 中 执行 语句 ,! 与 要 执行 的 语句 之 间 不 
需要 空格 ,任何 非 pdb 命令 都 被 解释 为 Python 
语句 并 执行 ,甚至 可 以 调用 函数 或 修改 当前 上 


下 文中 变量 的 值 


直接 回 车 则 默认 执行 上 一 个 命令 ,但 如 果 上 一 
个 命令 是 list, 则 会 列 出 接 下 来 的 11 行 代码 


可 以 通过 3 种 不 同 的 形式 来 使 用 pdb 模块 提供 的 调试 功能 ,分 别 为 在 交互 模式 下 调试 
特定 的 代码 块 、 在 程序 中 显 式 插入 断 点 以 及 把 pdb 作为 模块 来 调试 程序 , 接 下 来 分 别 进行 


简要 介绍 。 


(1) 在 交互 模式 下 使 用 pdb 模块 提供 的 功能 可 以 直接 调试 语句 块 . 表 达 式 、 函 数 等 多 种 
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脚本 ,常用 的 调试 方法 有 4 种 。 

(D pdb. runCstatement[. globals[. locals ] D: 调试 指定 语句 ,可 选 参数 globals 和 
locals 用 来 指定 代码 执行 的 环境 ,默认 是 _main_ 模 块 的 字典 。 

@ pdb. runeval(expression[ globals[. locals] D : 返回 表达 式 的 值 ,可 选 参数 globals 
和 locals 的 含义 与 上 面 run() 函 数 中 的 一 样 。 

@ pdb. runcall(function[ ，argument，…]) : 调试 指定 函数 。 

(4) pdb. post_mortem([traceback]): 进入 指定 traceback 对 象 的 事后 调试 模式 ,如 果 没 
有 指定 traceback 对 象 , 则 使 用 当前 正在 处 理 的 一 个 异常 。 

例如 ,下 面 的 代码 演示 了 如 何 调试 一 个 函数 ,其 中 “(Pdb)” 为 提示 符 , 在 后 面 输入 并 执 
行 前 面 表 8-1 中 介绍 的 命令 即 可 。 


>>> import pdb 
>>>def f(): 

x-5 

print x 
»»»pdb.runcall(£f) 
><pyshell# 5> (2)£() 
(Pdb) n 
><pyshell# 5» (3) £() 
(Pdb) 1 
[EOF] 
(Pdb) p x 
5 
(Pdb) n 
5 
--Return- - 
»«pyshellf 5» (3)f()-»None 
(Pdb) n 
>>> 


(2) 在 程序 中 嵌入 断 点 来 实现 调试 功能 。 

在 程序 中 首先 导入 pdb 模块 ,然后 使 用 pdb. set_trace() 在 需要 的 位 置 设置 断 点 。 如 果 
程序 中 存在 通过 该 方法 调用 显 式 插入 的 断 点 ,那么 在 命令 提示 符 环境 下 执行 该 程序 或 双击 
执行 程序 时 将 自动 打开 pdb 调试 环境 ,即使 该 程序 当前 不 处 于 调试 状态 。 例 如 下 面 的 
BUY: 

IsPrime.py: 

import pdb 

n-37 

pdb.set trace() 

for i in range (2,n) : 

if n$i--0: 
print 'No' 


break 
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else: 


print 'Yes' 


使 用 pdb 设置 的 断 点 ,运行 后 自动 打开 调试 模式 ,如 图 8-2 所 示 。 


>>> 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 RESTART = 


me.py (5) «module» () 
yt 


27Nisprime.py(6)«module» () 


5) «module» () 


\isprime.py (6)<module>() 


5)<module>() 


图 8-2 自动 打开 调试 模式 


在 命令 提示 符 环 境 中 运行 该 程序 同样 自动 打开 调试 模式 ,如 图 8-3 所 示 。 


图 8-3 自动 打开 调试 模式 


(3) 使 用 命令 行 调试 程序 。 

在 命令 行 提 示 符 下 执行 “python -m pdb 脚本 文件 名 ”, 则 直接 进入 调试 环境 ; 当 调试 结 
东 或 程序 正常 结束 以 后 ,pdb 将 重启 该 程序 。 例 如 ,把 上 面 的 程序 IsPrime. py 中 pdb 模块 
的 导入 和 断 点 插入 函数 都 删除 ,然后 在 命令 提示 符 环境 中 使 用 调试 模式 运行 ,如 图 8-4 
所 示 。 
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码 块 。 


图 8-4 ”以 调试 模式 运行 程序 


本 章 知识 精 要 


CD 异常 处 理 结构 可 以 提高 程序 的 容错 性 和 健壮 性 ,但 不 建议 过 多 依赖 异常 处 理 结构 。 
(2) 可 以 继承 Python 内 建 异 常 类 来 实现 自 定义 的 异常 类 

(3) 可 以 使 用 BaseException 来 捕获 所 有 异常 ,但 不 建议 这 样 做 。 

处 理 结 果 中 也 可 以 使 用 else 子 句 , 当 没有 异常 发 生 时 执行 else 子 句 中 的 代 


(5) 断言 语句 assert 一 般 用 于 对 程序 某 个 时 刻 必须 满足 的 条 件 进行 验证 。 
(6) E 下 文 管理 语句 with 在 代码 块 执行 完毕 后 能 够 自动 还 原 进入 代码 块 之 前 的 现场 


或 上 下 文 ,不 论 是 否 发 生 异 常 总 能 保证 资源 被 正确 释放 


(7) 异常 处 理 结构 的 finally 子 句 中 的 代码 仍 可 能 会 抛 出 异常 
(8) 可 以 通过 3 种 方式 使 用 pdb 模块 的 调试 功能 : 在 交互 模式 下 使 用 pdb 模块 的 方法 


调试 指定 函数 或 语句 、 在 程序 中 显 式 插 入 断 点 、 执 行 Python 程序 时 指定 pdb 调试 模块 。 


习 是 


1. Python 异常 处 理 结构 有 哪 几 种 形式 ? 
2. 异常 和 错误 有 什么 区 别 ? 
3. 使 用 pdb 模块 进行 Python 程序 调试 主要 有 哪 几 种 用 法 ? 


. Python en dE 
. 断言 语句 的 语法 
. Python 的 上 下 ses 理 语句 为 


ao e 


a 


第 二 篇 “Python 高 级 编程 与 应 用 


在 本 书 第 一 篇 中 ,重点 介绍 了 Python 的 基础 知识 ,包括 各 种 基本 数据 结 
构 、 控 制 结构 .类 与 函数 的 编写 .文件 操作 以 及 异常 处 理 结构 和 Python 程序 调 
试 技术 等 。 第 一 篇 是 最 重要 的 一 部 分 知识 ,也 是 学 习 和 熟练 运用 大 量 扩 展 库 的 
必 备 知识 。 虽 然 说 Python 就 像 胶水 一 样 能 够 把 很 多 不 同 语言 夭 合 在 一 起 , 虽 
然 说 Python 更 多 的 工作 需要 借助 于 扩展 库 来 实现 ,但 是 Python 基础 知识 的 党 
握 和 理解 对 于 任何 应 用 开发 工作 都 具有 非常 重要 的 作用 。 

在 理解 和 掌握 并 能 够 熟练 运行 Python 基础 知识 以 后 ,本 书 第 二 篇 则 把 重 
点 放 在 了 一 些 扩 展 库 的 应 用 上 。 当 然 , Python 扩展 库 几 乎 涉及 所 有 领域 和 行 
业 , 一 本 书 也 不 可 能 给 出 非常 全 面 的 介绍 ,作者 仅 选 取 了 部 分 领域 和 扩展 库 进 
行 了 入 门 级 的 介绍 ,更 多 的 内 容 还 需要 读者 查阅 帮助 文档 以 满足 实际 开发 中 的 
需求 。 同 时 ,在 同一 个 领域 也 存在 不 同 的 扩展 库 , 这 些 扩展 库 各 有 特点 ,可 能 需 
要 读者 根据 具体 的 需要 以 及 所 使 用 的 操作 系统 平台 和 Python HK AAT HH Fo 
选择 。 

在 第 1 章 曾 经 提 到 过 ,pip 是 管理 Python 扩展 库 的 重要 工具 , 绝 大 多 数 的 
扩展 库 都 可 以 使 用 pip 来 安装 、 升 级 和 印 载 ,读者 需要 做 的 仅仅 是 在 保证 联网 的 
情况 下 执行 几 条 命令 而 已 ,这 一 点 对 本 书后 面 的 绝 大 部 分 扩展 库 都 是 适用 的 。 
如 果 您 遇 到 无 法 通过 pip 安装 或 者 安装 之 后 无 法 使 用 的 扩展 库 , 很 可 能 该 扩展 
库 需 要 使 用 独立 的 安装 包 来 安装 ,或 者 还 依赖 一 些 dll 文件 ,此 时 建议 您 登录 其 
官方 网 站 下 载 安 装 包 或 依赖 文件 。 


第 9 章 GUI 编程 


在 前 面 所 有 章节 以 及 后 面 的 大 部 分 章节 中 ,我 们 都 是 使 用 控制 台 应 用 程序 的 编写 来 演 
示 Python 语言 的 精妙 和 强大 。 然 而 ,最 终 用 户 可 能 更 习惯 使 用 GUI 程序 ,毕竟 现在 已 经 很 
少 有 终端 用 户 使 用 控制 台 的 命令 行 工作 模式 了 ,他 们 更 希望 看 到 带 有 窗口 .按钮 .菜单 、 组 合 
框 、 列 表 框 等 GUI 元 素 的 应 用 程序 ,也 许 这 也 正 是 读者 的 需求 。 为 此 ,本 章 介绍 了 Python 
的 GUI 编程 ,让 读者 的 程序 更 容易 使 用 和 操作 。 

目前 ,常用 GUI 工具 除了 Python 标准 GUI 库 Tkinter, 还 有 功能 强大 的 跨 平台 库 
wxPython、 基 于 Java 的 Jython, Xx fj. NET 应 用 程序 的 IronPython 等 。 本 章 以 wxPython 
为 例 来 介绍 Python 的 GUI 应 用 开发 ,有 了 wxPython 的 基础 ,相信 读者 也 能 很 快 掌 握 和 使 
用 其 他 GUI 库 。 

在 本 书 编写 时 , wxPython 的 最 新 版 本 是 3. 0, 读 者 可 以 登录 网 页 http: //wxpython. 
org/download. php 进行 下 载 并 安装 。 

使 用 wxPython 创建 GUI 程序 的 3 个 主要 步骤 如 下 。 

(1) 导入 wxPython 包 。 

(2) 建立 框架 类 。 框 架 类 的 父 类 为 wx. Frame, 在 框架 类 的 构造 函数 中 调用 父 类 的 构造 
函数 进行 初始 化 ;然后 为 frame 类 添加 各 种 控件 以 及 事件 处 理 方法 ,如 需 在 窗 体 上 增加 其 他 
控件 ,可 在 构造 函数 中 增加 代码 ,如 需 处 理 相应 事件 ,可 增加 框架 类 的 成 员 函 数 ,并 将 事件 处 
理 方法 与 相应 的 控件 进行 绑 定 。 

(3) 建立 主 程序 。 通 常 需要 做 4 件 事 一 一 创建 应 用 程序 对 象 、 创 建 框架 类 对 象 . 显 示 框 
架 、 开 始 事件 循环 。 执行 frame. Show (True) 后 ,框架 才能 看 得 见 ,执行 app. MainLoop( ) 
后 ,框架 才能 处 理事 件 。 


9.1 Frame 


Frame 也 称 为 框架 或 窗 体 , 它 是 所 有 框架 的 父 类 ,也 是 包含 标题 栏 .菜单 按钮 等 其 他 控 
件 的 容器 ,运行 之 后 可 移动 缩放 。 

创建 GUI 程序 框架 时 ,需要 使 用 继承 wx. Frame 派生 出 子 类 ,在 派生 类 中 调用 基 类 构 
造 函 数 进行 必要 的 初始 化 ,其 构造 函数 格式 如 下 : 

. init _ (self, Window parent, int id=- 1, String title= EmptyString, Point pos= 

DefaultPosition, Size size- DefaultSize, long style- DEFAULT FRAME STYIE, String name- 


FrameNameStr) 
各 参数 具体 含义 如 下 。 


(1) parent: 框架 的 父 窗 体 。 该 值 为 None 时 表示 创建 顶级 窗 体 。 
(2) id: 新 窗 体 的 wxPython ID 号 。 可 以 明确 地 传递 一 个 唯一 的 ID ,也 可 传递 一 1, 这 
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时 wxPython 将 自动 生成 一 个 新 的 ID, 由 系统 来 保证 其 唯一 性 。 

(3) title: 窗 体 的 标题 。 

(4) pos: wx. Point 对 象 , 用 来 指定 新 窗 体 的 左上 角 在 屏幕 中 的 位 置 。 通 常 (0,0) 是 显 
示 器 的 左上 和 角 坐 标 。 当 将 其 设 定 为 wx. DefaultPosition 的 ,其 值 为 (一 1, 一 1), 表 示 让 系统 
决定 窗 体 的 位 置 。 

(5) size: wx. Size 对 象 ,用 来 指定 新 窗 体 的 初始 大 小 。 当 将 其 设 定 为 wx. DefaultSize 
时 ,其 值 为 (一 1, 一 1) ,表示 由 系统 来 决定 窗 体 的 初始 大 小 。 

(6) style; 指定 窗 体 的 类 型 的 常量 ,wx. Frame 的 常用 样式 如 表 9-1 所 示 。 对 一 个 窗 体 
控件 可 以 同时 使 用 多 个 样式 ,使 用 * 位 或 ?运算 符 | 连 接 即 可 。 比 如 wx. DEFAULT _ 
FRAME STYLE 样式 就 是 由 以 下 几 个 基本 样式 的 组 合 : wx. MAXIMIZE, BOX | wx. 
MINIMIZE BOX | wx. RESIZE BORDER | wx. SYSTEM MENU | wx. CAPTION | 
wx. CLOSE_BOX。 要 从 一 个 组 合 样式 中 去 掉 个 别 的 样式 可 以 使 用 ^ 按 位 异 或 操作 符 , 例 
如 ,要 创建 一 个 默认 样式 的 窗 体 ,但 要 求 用 户 不 能 缩放 和 改变 窗 体 的 尺寸 ,可 以 使 用 这 样 的 
组 合 : wx. DEFAULT_FRAME_STYLE^(wx. RESIZE_BORDER | wx. MAXIMIZE _ 
BOX | wx. MINIMIZE BOX), 


R 9-1. wx. Frame 的 常用 样式 


样 R 说 明 
wx. CAPTION 增加 标题 栏 
wx. DEFAULT_FRAME_STYLE | 默认 样式 
wx. CLOSE_BOX 标题 栏 上 显示 “关闭 "按钮 
wx. MAXIMIZE_BOX 标题 栏 上 显示 “最 大 化 ”按钮 
wx. MINIMIZE_BOX 标题 栏 上 显示 “最 小 化 ”按钮 
wx. RESIZE_BORDER 边框 可 改变 尺寸 
wx. SIMPLE_BORDER 边框 没有 装饰 
wx. SYSTEM_MENU 增加 系统 菜单 (有 “关闭 ”“ 移 动 "“ 改 变 尺寸 "等 功能 ) 
wx. FRAME_SHAPED LE nS SetShape() 方 法 来 创建 一 个 非 矩形 
wx. FRAME TOOL WINDOW 给 框架 一 个 比 正 常 小 的 标题 栏 ,使 框架 看 起 来 像 一 个 工具 框 窗 体 


(7) name; 框架 的 名 字 ,指定 后 可 以 使 用 这 个 名 字 来 寻找 这 个 窗 体 。 
可 以 看 到 ,wx. Frame. init ( ) 方 法 只 有 一 个 参数 parent 没有 默认 值 ,因而 最 简单 的 


wx.Frame. init (self, parent-None) 


这 将 生成 一 个 默认 位 置 默认 大 小 、 默 认 标 题 的 顶层 窗 体 。 

在 初始 化 窗 体 时 可 以 明确 给 构造 函数 传递 一 个 正 整 数 作为 新 窗 体 的 ID, 此 时 由 程序 员 
自己 来 保证 ID 不 重复 并 且 没 有 与 预定 义 的 ID 号 冲突 。 例 如 ,不 能 使 用 wx. ID_OK 
(5100) wx. ID_CANCEL (5101), wx. ID_ANY(—1)、wx. ID. COPY (5032) 和 wx. ID_ 
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APPLY(5102) 等 预定 义 ID 号 对 应 的 数值 。 

如 果 您 无 法 确定 使 用 哪个 数值 作为 ID 的 话 , 可 以 使 用 wx. NewId() 函 数 来 生成 ID 号 ， 
这 样 就 可 以 避免 确保 ID 号 唯一 性 的 麻烦 。 

id =wx.NewId() 


frame -wx.Frame. init (None, id) 


当然 ,也 使 用 全 局 常量 wx. ID. ANY Cf 9g — Dok ib wxPython 自动 生成 新 的 唯一 ID 
号 ,需要 时 可 以 使 用 GetId() 方 法 来 得 到 它 ,例如 : 


frame -wx.Frame. init (None, -1) 
id =frame.GetId() 


在 本 节 的 最 后 ,我 们 通过 一 个 具体 的 示例 来 演示 使 用 wxPython 创建 GUI 应 用 程序 的 
思路 ,将 下 面 的 代码 保存 并 运行 , 则 会 在 窗 体 上 的 文本 框 中 动态 显示 鼠标 相对 于 窗 体 ( 即 窗 
体 左 上 和 角 坐标 为 (0,0)) 的 当前 位 置 ,可 以 移动 鼠标 并 观察 值 的 变化 。 


import wx 
class Frame0 (wx.Frame) : 
def init__(self, superior): 
wx.Frame. init  (self,parent- superior, title-u'My First Form', size- (300, 300)) 
panel -wx.Panel (self) 
panel.Bind(wx.EVT MOTION, self.OnMove) # 绑 定 事 件 处 理 函 数 
wx.StaticText (parent- panel, label= "Pos:", pos= (10, 20)) 
self.posCtrl -wx.TextCtrl (parent- panel,pos- (40, 20)) 
def OnMove (self, event) : # 鼠 标 移动 事件 处 理 函 数 
pos -event.GetPosition() 
self.posCtrl.SetValue("$s, $s" 
%(pos.x, pos.y)) 
if name --' main ': 
app —-wx.App() 


frame — Frame0 (None) 


Pos: 277,248 


frame.Show (True) 
app -MainLoop () 
运行 结果 如 图 9-1 所 示 , 当 鼠标 在 窗 体内 移动 时 ,文本 
框 内 实时 显示 鼠标 当前 坐标 , 当 鼠 标 移动 到 窗 体 之 外 时 ， erm 
文本 框 中 的 数值 将 不 再 变化 。 图 9-1 显示 鼠标 位 轩 


9.2 Controls 


wxPython 提供 了 几乎 所 有 常用 的 控件 ,如 按钮 .静态 文本 标签 ,文本 框 \ 单 选 按钮 、 复 
选 框 、 对 话 框 、 菜 单 、 列 表 框 和 树 形 控 件 等 。 如 需 在 窗 体 上 增加 其 他 控件 ,可 在 窗 体 构 造 函 数 
中 增加 代码 ;如 需 响 应 和 处 理 特定 事件 ,可 增加 框架 类 的 成 员 函 数 , 并 进行 相应 的 绑 定 操作 。 
在 本 节 中 ,通过 几 个 示例 来 演示 wxPython 控件 的 用 法 。 为 了 方便 介绍 ,大 致 根据 控件 的 类 
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型 将 控件 进行 了 不 同 的 组 合 放 在 一 起 介绍 ,而 不 是 孤零零 地 单个 介绍 控件 的 用 法 。 
9.2.1 Button,StaticText 和 TextCtrl 
按钮 控件 的 构造 函数 语法 如 下 : 


init (self, Window parent, int id= - 1, String label = EmptyString, Point pos = 


DefaultPosition, Size size = DefaultSize, long style = 0, Validator validator = 
DefaultValidator, String name =ButtonNameStr) 


按钮 主要 用 来 接受 用 户 的 单 击 操作 ,而 按钮 上 面 的 文本 一 般 是 创建 时 直接 指定 的 ,很 少 
需要 修改 。 当 然 , 如 果 确 实 需要 动态 修改 的 话 ,可 以 通过 SetLabelText() 方 法 来 实现 这 个 目 
的 ,再 结合 GetLabelText() 方 法 来 获取 按钮 控件 上 面 显 示 的 文本 , 则 可 以 实现 同一 个 按钮 
完成 不 同 功能 的 目的 。 为 按钮 绑 定 事件 处 理 函 数 的 方法 为 


Bind (event, handler, source-None, id-- 1, id2-- 1) 


静态 文本 控件 主要 用 来 显示 文本 或 给 用 户 操作 提示 ,不 接受 用 户 单 击 或 双击 事件 ,可 以 
使 用 SetLabel() 方 法 动态 为 StaticText 控件 设置 文本 。 静 态 文本 控件 的 构造 函数 语法 
如 下 : 


. .init (self, Window parent, int id= - 1, String label= EmptyString, Point pos= 
DefaultPosition, Size size=DefaultSize, long style- 0, String name- StaticTextNameStr) 


文本 框 主要 用 来 接受 用 户 的 文本 输入 ,可 以 使 用 GetValue() 方 法 获取 文本 框 中 输入 的 
内 容 , 使 用 SetValue() 方 法 设置 文本 框 中 的 文本 ,文本 框 控件 的 构造 函数 语法 如 下 : 


. .init (self, Window parent, int id= - 1, String value= EmptyString, Point pos= 
DefaultPosition, Size size = DefaultSize, long style = 0, Validator validator = 
DefaultValidator, String name- TextCtrlNameStr) 


下 面 通 过 一 个 示例 来 演示 这 3 个 控件 的 用 法 ,将 下 面 的 代码 保存 为 wxIsPrime. py. 32 
行 后 用 户 输入 一 个 整数 , 单 击 按钮 后 判断 是 否 为 素数 并 输出 结 


import wx 
from math import sqrt 


class IsPrimeFrame (wx.Frame): 
def init (self, superion): 
wx.Frame. init (self, parent- superion, title- 'Check Prime', size- (400,200)) 


panel =wx.Panel (self) 


panel.SetBackgroundColour ("Yellow") # 设 置 窗 体 背 景 颜色 
wx.StaticText (parent=panel, label= 'Input a integer:', pos- (10,10)) 

# 添 加 静态 文本 控件 
self.inputN —wx.TextCtrl(parent-panel, pos- (120,10)) # 添 加 文本 框 


self.result =wx.StaticText (parent-panel, label= '', pos- (10,50)) 
self.buttonCheck —wx.Button (parent-panel, label- 'Check', pos- (70,90)) 
# 添 加 按钮 
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# 为 按钮 绑 定 事件 处 理 方法 

self.Bind(wx.EVT BUTTON, self.OnButtonCheck, self.buttonCheck) 
self.buttonQuit =wx.Button (parent=panel, label= 'Quit', pos= (150,90)) 
self.Bind(wx.EVT BUTTON, self.OnButtonQuit, self.buttonQuit) 


def OnButtonCheck (self, event): 
self.result.SetLabel('') 
try: 
num = int (self.inputN.GetValue()) # 获 取 用 户 输入 的 数字 
except BaseException,e: 
self.result.SetLabel ("not a integer') 
return 


n = int (sqrt (num) ) 


for i in range (2,n* 1) : # 判 断 用 户 输入 的 数字 是 否 为 素数 
if num$i ==0: 
self.result .SetLabel ('No') # 使 用 静态 文本 框 显 示 结 果 
break 


else: 
self.result.SetLabel ('Yes') 


def OnButtonQuit (self, event): 
dlg-wx.MessageDialog (self, 'Really Quit?', 'Caution',\ 
WXx.CANCEL|wx.OK|wx.ICON QUESTION) 
if dlg.ShowModal() ==wx.ID_OK: 
self.Destroy() 


frame = IsPrimeFrame (None) 
frame.Show() 


app.MainLoop() 
运行 结果 如 图 9-2 所 示 。 


Input a integer 


图 9-2 素数 判断 


9.2.2 Menu 


菜单 可 以 分 为 普通 菜单 和 弹出 式 菜单 两 大 类 .其 中 普通 菜单 也 就 是 大 多 数 窗口 菜单 栏 
的 下 拉 菜 单 ,弹出 式 菜单 也 称 为 上 下 文 菜单 ,一 般 需要 使 用 鼠标 右键 激活 ,并 根据 不 同 的 环 
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境 或 上 下 文 来 显示 不 同 的 菜单 项 。 下 面 对 这 两 类 菜单 分 别 进行 介绍 。 
1. 创建 普通 菜单 


self.frame =wx.Frame (parent=None, title= 'wxGUI', size= (640,480)) 
self.panel —wx.Panel (self.frame, -1) 


self.menuBar —wx.MenuBar () # 创 建 菜单 栏 
self.menu =wx.Menu () # 创 建 菜单 
self.menuOpen = self.menu.Append101, 'Open') 30] d AM 


self.menuSave = self.menu.Append(102, 'Save') 
self.menuSaveAs = self.menu.Append(103, 'Save As') 


self.menu.AppendSeparator () # 分 隔 符 
self.menuClose = self.menu.Append(104, 'Close') 
self.menuBar.Append(self.menu, '&File') # 将 菜单 添加 至 菜单 栏 


self .menu =wx.Menu () 

self .menuCopy = self.menu.Append (201, 'Copy') 
self .menuCut = self.menu.Append (202, 'Cut') 
self.menuPaste = self.menu.Append(203, 'Paste') 
self.menuBar.Append (self.menu, '&Edit') 


创建 菜单 完成 之 后 ,通过 下 面 的 代码 将 创建 的 菜单 设置 为 窗 体 菜单 。 
self.frame.SetMenuBar (self.menuBar) 


2. 创建 弹出 式 菜单 

self.popupMenu =wx.Menu () # 创 建 菜单 
self.popupCopy = self.popupMenu.Append(901, 'Copy') # 创 建 菜 单项 
self.popupCut = self.popupMenu.Append (902, 'Cut') 

self.popupPaste = self.popupMenu.Append(903, 'Paste') 


接 下 来 为 窗 体 绑 定 右 击 操作 ， 

self.Bind(wx.EVT RIGHT DOWN, self.OnRClick) 

然后 编写 右 击 处 理 函数 ,用 户 右 击 时 弹出 上 面 定义 的 弹出 式 菜单 。 
def OnRClick(self, event): 


pos = (event.GetX() ,event .GetY () ) # 获 取 鼠 标 当前 位 置 
self.panel.PopupMenu (self.popupMenu, pos) # 在 鼠标 当前 位 置 弹出 上 下 文 菜单 


3. 为 菜单 项 绑 定 单 击 事件 处 理 函 数 

对 于 普通 下 拉 式 菜单 和 弹出 式 菜单 ,为 菜单 项 绑 定 事 件 处 理 函 数 的 方式 是 一 样 的 ,例如 
下 面 的 代码 ,其 中 第 二 个 数值 型 的 参数 是 菜单 项 的 ID ,最 后 一 个 参数 是 事件 处 理 函 数 的 名 
称 。 绑 定之 后 ,运行 程序 并 单 击 某 菜单 项 , 则 会 执行 相应 的 事件 处 理 函 数 中 的 代码 。 


wx.EVT MENU(self, 102, self.OnOpen) 
wx.EVT MENU(self, 103, self.OnSave) 

wx.EVT MENU (self, 104, self.OnSaveAs) 
wx.EVT MENU (self, 105, self.OnClose) 
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4. 编写 菜单 项 的 单 击 事件 处 理 函 数 
具体 的 事件 处 理 函 数 根据 不 同 的 业务 逻辑 有 所 不 同 , 这 里 仅 演示 如 何在 状态 栏 上 显示 
一 段 文本 ,有 关 状 态 栏 的 介绍 请 参考 9. 2. 3 节 。 
def OnNew (self，event) : 
self.statusBar.SetStatusText ("You clicked the New menu. ') 


9.2.3 ToolBar 和 StatusBar 


工具 栏 往往 用 来 显示 当前 上 下 文 最 常用 的 功能 按钮 ,一 般 而 言 , 工 具 栏 按钮 是 菜单 全 部 
功能 的 子 集 。 状 态 栏 主要 用 来 显示 当前 状态 或 给 用 户 友好 提示 ,例如 , Word 软件 中 的 状态 
栏 上 显示 的 当前 页 码 、 总 页 数 、 节 数 以 及 当前 行 与 当前 列 等 信息 。 下 面 我 们 分 别 介 绍 这 两 个 
控件 的 创建 和 使 用 方法 。 

1. 创建 工具 栏 

self.toolbar =self.frame.CreateToolBar () 


接 下 来 在 工具 栏 上 添加 工具 ,相应 的 工具 栏 图 片 需要 提前 准备 好 ,并 存放 于 当前 目录 下 。 

self.toolbar.AddSimpleTool (9999, wx. Image ('open.png',wx.BITMAP TYPE PNG).ConvertToBitmap 

(),"Open', 'Click to Open a file') 

然后 使 用 下 面 的 代码 使 工具 栏 有 效 。 

self.toolbar.Realize() 

最 后 绑 定 事件 处 理 函 数 , 事 件 处 理 函 数 的 编写 与 前 面 介 绍 的 按钮 .菜单 项 等 控件 的 事件 
处 理 函 数 一 样 ,不 再 袭 述 。 

wx.EVT TOOL(self, 9999, self.OnOpen) 

2. 创建 状态 栏 

状态 栏 的 创建 和 使 用 相对 比较 简单 ,通过 下 面 的 代码 即 可 创建 : 

self.statusBar =self.frame.CreateStatusBar () 

如 果 需 要 在 状态 栏 上 显示 状态 或 者 显示 文本 以 提示 用 户 ,可 以 通过 下 面 的 代码 设置 状 
态 栏 文本 : 


self.statusBar.SetStatusText ('You clicked the Open menu.') 


9.2.4 对 话 框 


wxPython 提供 了 一 整套 丰富 的 预定 义 对 话 框 支持 友好 界面 开发 ,常用 的 对 话 框 有 以 
下 7 种 。 

(1) MessageBox: 简单 消息 框 。 

(2) GetTextFromUser: 接受 用 户 输入 的 文本 。 

(3) GetPasswordFromUser: 接受 用 户 输入 的 密码 。 

(4) GetNumberFromUser: 接受 用 户 输入 的 数字 。 
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(5) FileDialog:“ 文 件 ? 对 话 框 。 

(6) FontDialog:“ 字 体 ” 对 话 框 。 

(7) ColourDialog:“ 颜 色 ? 对 话 框 。 

除 用 于 信息 提示 的 简单 消息 框 之 外 .其 他 几 种 对 话 框 的 使 用 都 遵循 固定 的 步骤 : 首先 
创建 对 话 框 ,其 次 显示 对 话 框 ,最 后 根据 对 话 框 的 返回 值 采取 不 同 的 操作 。 下 面 的 代码 演示 
了 MessageBox 的 用 法 ,完整 代码 可 以 参照 9. 2.5 节 的 示例 。 


wx.MessageBox (finalStr) 


下 面 的 代码 演示 了 MessageDialog 的 用 法 ,完整 代码 请 参考 9. 2. 1 小 节 。 其 他 对 话 框 
可 以 参考 MessageDialog 对 话 框 的 用 法 。 


def OnButtonQuit (self, event): 
dlg-wx.MessageDialog (self, "Really Quit?', 'Caution', wx.CANCEL|wx.OK| \ 
wx.ICON QUESTION) 
if dlg.ShowModal() ==wx.ID_OK: 
self.Destroy() 


9.2.5 RadioButton ,CheckBox 和 ComboBox 


单 选 按钮 常用 来 实现 用 户 在 多 个 选项 中 的 互 斥 选择 ,在 同一 组 内 多 个 选项 中 只 能 选择 
一 个 ,当选 择 发 生变 化 之 后 ,之 前 选择 的 选项 自动 失效 。 单 选 钮 控件 的 构造 函数 语法 如 下 : 
. .init (self, Window parent, int id= - 1, String label= EmptyString, Point pos= 
DefaultPosition, Size size = DefaultSize, long style = 0, Validator validator = 
DefaultValidator, String name=RadioButtonNameStr) 


可 以 使 用 wxPython 的 SashWindow 控件 对 单 选 钮 进行 分 组 ,也 可 以 使 用 单 选 钮 控件 的 样 
式 进行 分 组 ,每 组 的 第 一 个 单 选 钮 使 用 wx. RB. GROUP 样式 ,其 他 单 选 框 不 使 用 该 样式 。 

复 选 框 往往 用 来 实现 非 互 斥 多 选 的 功能 ,多 个 复 选 框 之 间 的 选择 互 不 影响 。 复 选 框 的 
构造 函数 语法 如 下 : 


. init (self, Window parent, int id-- 1, String label=EmptyString, Point pos= 


DefaultPosition, Size size=DefaultSize, long style=0, Validator 
validator=DefaultValidator, String name- CheckBoxNameStr) 


单 选 按钮 和 复 选 框 的 很 多 操作 是 通用 的 ,例如 ,可 以 使 用 GetValue() 方 法 判断 单 选 按 
钮 是 否 被 选中 ,使 用 SetValue(True) 将 单 选 按钮 设置 为 选中 状态 ,使 用 SetValue(False) 将 

组 合 框 用 来 实现 从 固定 的 多 个 选项 中 选择 其 中 一 个 的 操作 ,外 观 与 文本 框 类 似 ,但 是 单 
击 下 拉 箭 头 时 弹出 所 有 可 选项 , 极 大 地 方便 了 用 户 的 操作 ,并 且 在 窗 体 上 不 占用 太 大 的 空 
间 。 组 合 框 的 构造 函数 语法 如 下 : 

. init (Window parent, int id- - 1, String value= EmptyString, Point pos- DefaultPosition, 


Size size = DefaultSize, List choices- EmptyList, long style = 0, Validator validator = 
DefaultValidator, String name- ComboBoxNameStr) 
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在 某 些 应 用 中 ,可 能 需要 响应 单 选 按钮 、 复 选 框 以 及 组 合 框 的 单 击 事件 ,根据 不 同 的 需 
要 可 以 使 用 wx. EVT_RADIOBOX()、wx. EVT. CHECKBOX O fll wx. EVT_COMBOBOX O 
分 别 为 单 选 按钮 、 复 选 框 和 组 合 框 来 绑 定 事件 处 理 函 数 。 

下 面 的 代码 演示 了 这 3 个 控件 的 用 法 。 


import wx 
class wxGUI (wx.App) : 
def OnInit(self): 


self.frame =wx.Frame (parent=None, title- 'wxGUI', size= (640,480)) 
self.panel —wx.Panel(self.frame, -1) 


self.radicButtonSexM —wx.RadioButton(self.panel, -1, 'Male', pos- (280,160)) 
self.radioButtonSexF =wx.RadioButton(self.panel, -1, 'Female', pos= (280,180)) 
self.checkBoxAdmin —wx.CheckBox(self.panel, -1, 'Aministrator', pos- (350,180)) 


self.labell =wx.StaticText (self.panel, - 1, 'UserName:', pos- (200,210), style- wx. 
ALIGN RIGHT) 
self.label2 =wx.StaticText (self.panel, -1, 'Password:', pos- (200,230), style- wx. 
ALIGN RIGHT) 


self.textName —wx.TextCtrl (self.panel, -1, pos= (270,210), size- (160,20)) 
self.textPwd -wx.TextCtrl(self.panel, -1, pos- (270,230), size- (160,20), style-wx. 
TE PASSWORD) # 密 码 文本 框 


self.buttonOK =wx.Button(self.panel, -1, 'OK', pos- (230,260)) 
self.Bind(wx.EVT BUTTON, self.OnButtonOK, self.buttonOK) 
self.buttonCancel =wx.Button(self.panel, -1, 'Cancel', pos- (320,260)) 
self.Bind(wx.EVT BUTTON, self.OnButtonCancel, self.buttonCancel) 
self.buttonOK.SetDefault () 


# ComboBox 
self.comboBox = wx.ComboBox (self.panel, value= 'Click here',\ 
choices- ['a', 'b','c'],N 
pos- (200,100), size- (100,30)) 
self.Bind(wx.EVT COMBOBOX, self.OnCombo, self.comboBox) 


self.frame.Show() 


return True 


def OnCombo (self, eve&fjr HE M ih F fF Ab FE eR C 


wx.MessageBox (self .comboBox.GetValue ()) 


def OnButtonOK (self, édBHE)H P 58 A 38 Hi daa 


finalstr -'' 

if self.radioButtonSexM.GetValue() ==True: 
finalStr += 'Sex:MaleWn' 

elif self.radioButtonSexF.GetValue() ==True: 
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finalStr += 'Sex:FemaleWn' 
if self.checkBoxAdmin.GetValue() ==True: 
finalStr += 'AdministratorW' 
if self.textName.GetValue ()== 'dongfuguo' and self.textPwd.GetValue () 
== 'dongfuguo' : 
finalStr += 'user name and password are correct\n' 
else: 
finalStr += 'user name or password is incorrect\n' 


wx.MessageBox (finalstr) 


def OnButtonCancel (sci iff vee A 


self.radioButtonSexM. SetValue (True) 
self.radioButtonSexF.SetValue (False) 
self.checkBoxAdmin.SetValue (True) 
self.textName.SetValue|('') 
self.textPwd.SetValue('') 


app =wxGUI () 

app .MainLoop () 

上 面 的 代码 运行 结果 如 图 9-3 所 示 , 单 击 组 合 框 并 改变 选择 之 后 会 自动 弹出 消息 框 提 
示 选 择 的 项 ,选择 单 选 按钮 、 复 选 框 并 输入 文本 框 中 要 求 的 用 户 名 和 密码 之 后 , 单 击 OK 按 
钮 会 弹出 消息 框 提 示 输 入 和 选择 的 内 容 , 单 击 Cancel 按钮 自动 清除 用 户 的 输入 ,并 默认 将 


单 选 按钮 Male 设置 为 选中 状态 。 


9.2.6 ListBox 


列表 框 用 来 放置 多 个 元 素 并 提供 给 用 户 进行 选择 ,其 中 每 个 元 素 都 是 字符 串 ,支持 用 户 


单 选 和 多 选 。 列 表 框 的 常用 样式 和 常用 方法 如 表 9-2 和 表 9-3 所 示 。 
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Ofensle [Ministrator 


UserName: 


Password: 


Ceea] 


9-3 单 选 按钮 . 复 选 框 和 组 合 框 的 用 法 
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X92 列表 框 的 常用 样式 


样 式 说 明 
wx. LB EXTENDED 可 以 使 用 Shift 键 和 鼠标 配合 选择 连续 多 个 元 素 
wx. LB MULTIPLE 可 以 选择 多 个 不 连续 的 元 素 


wx. LB SINGLE 


最 多 只 能 选择 一 个 元 素 


wx. LB ALWAYS SB 


始终 显示 一 个 垂直 滚动 条 


wx. LB HSCROLL 


仅 在 需要 时 显示 一 个 垂直 滚动 条 


wx. LB SORT 列表 框 中 的 元 素 按 字 母 顺 序 排序 
表 9-3 列表 框 的 常用 方法 
方法 名 说 明 
Append(string) 在 列表 框 尾部 增加 一 个 元 素 
Clear 删除 列表 框 中 的 所 有 元 素 


DeleteCindex) 


删除 列表 框 指定 索引 的 元 素 


FindString(string) 


返回 指定 元 素 的 索引 , 没 找到 则 返回 一 1 


GetCount() 


返回 列表 框 中 元 素 的 个 数 


GetSelection() 


返回 当前 选择 项 的 索引 , 仅 对 单 选 列 表 框 有 效 


SetSelection(index, True/False) 


设置 指定 索引 的 元 素 的 选择 状态 


GetStringSelection() 


返回 当前 选择 的 元 素 , 仅 对 单 选 列表 框 有 效 


GetString(index) 


返回 指定 索引 的 元 素 


SetString(index, string) 


设置 指定 索引 的 元 素 文本 


GetSelections() 


返回 包含 所 选 元 素 的 元 组 


InsertItems(items, pos) 


在 指定 位 置 之 前 插入 元 素 


IsSelected(index) 


返回 指定 索引 的 元 素 的 选择 状态 


Set( choices) 


使 用 列表 choices 的 内 容重 新 设置 列表 框 


下 面 的 代码 演示 了 列表 框 的 用 法 ,运行 程序 后 ,列表 框 中 显示 周 日 到 周 六 的 每 天 ,用 户 


import wx 


class ListBoxDemo (wx.Frame) : 


单 击 其 中 一 个 后 弹出 一 个 消息 框 来 提示 所 选择 的 内 容 , 单 击 Quit 按钮 时 弹出 关闭 前 的 确认 


def init (self, superion): 


wx.Frame. init (self, parent=superion, title= 'ListBox demo', size= (200,200)) 


panel —wx.Panel (self) 


self.buttonQuit =wx.Button (parent=panel, label= 'Quit', pos- (60,120)) 
self.Bind(wx.EVT BUTTON, self.OnButtonQuit, self.buttonQuit) 
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li = ['Sunday', 'Monday' , "Tuesday", 'Wednesday' , 'Thursday' , 'Friday', 
"Saturday'] 

self.listBox =wx.ListBox (panel, choices- li) # 创 建 列表 框 
self.Bind(wx.EVT LISTBOX, self.OnClick, self.listBox) 间 绑 定 事件 处 理 函 数 


def OnClick(self, event): 
#t —self.listBox.GetSelection() 
#s —self.listBox.GetString(t) 
s = self.listBox.GetStringSelection () 


wx.MessageBox (s) 


def OnButtonQuit (self, event): 
dlg-wx.MessageDialog (self, 'Really Quit?', 'Caution',\ 
wx.CANCEL|wx.OK|wx.ICON QUESTION) 
if dlg.ShowModal() ==wx.ID_OK: 
self.Destroy() 


mm Listhox deno|. |O|X 


if name --' main ': 
app =wx.App () 
frame = ListBoxDemo (None) 
frame.Show() 


app.MainLoop () 


运行 结果 如 图 9-4 所 示 。 


图 9-4 列表 框 用 法 
9.2.7 TreeCtrl 
树 形 控件 常用 来 显示 有 严格 层次 关系 的 数据 ,可 以 非常 清晰 地 表述 各 元 素 之 间 的 从 属 
关系 或 层级 关系 ,比如 Windows 资源 管理 器 左 侧 窗口 ( 见 图 9-5) 以 及 注册 表 编 辑 器 ( 见 
图 9-6) 。 
树 形 控件 的 构造 函数 语法 如 下 : 
. init (self, Window parent, int id-- 1, Point pos-DefaultPosition, Size size=DefaultSize, 


long style = TR DEFAULT STYLE, Validator validator = DefaultValidator, String name = 
TreeCtrlNameStr) 


由 于 大 多 数 参 数 均 有 默认 值 ,使 用 下 面 的 代码 就 可 以 创建 一 个 简单 的 树 形 控件 : 
tree =wx.TreeCtr] (panel) 
树 形 控件 的 常用 方法 和 事件 分 别 如 表 9-4 和 表 9-5 所 示 。 

Xa 树 形 控件 的 常用 方法 


P :法 说 å 
root = tree. AddRoot(string) 增加 根 节点 ,返回 根 节点 ID 
child= tree. AppendItem(item, string) 为 指定 节点 增加 下 级 节点 ,返回 新 节点 ID 
SetItemText(item, string) 设置 节点 文本 
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图 9-6 注册 表 编 辑 器 界面 


续 表 


方 法 说 明 
GetItemTextO 返回 节点 文本 
SetItemPyData(item，ojb) 设置 节点 数据 
GetItemPyData(item) 返回 指定 节点 的 数据 
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方 ”法 说 明 
Expand(item) 展开 指定 节点 ,但 不 展开 下 级 节点 
ExpandAllO) 展开 所 有 节点 
Collapse(item) 收 起 指定 节点 
CollapseAndReset() 收 起 指定 节点 并 删除 其 下 级 节点 
GetRootItem() 返回 根 节点 ID 
(childID, cookie) = GetFirstChild(item) 返回 指定 节点 的 第 一 个 子 节点 
flag = child. IsOk() 测试 节点 ID 是 否 有 效 


(item, cookie) = GetNextChild(item, cookie) 


返回 同 级 的 下 一 个 节点 


GetLastChild(item) 


返回 指定 节点 的 最 后 一 个 子 节点 


GetPrevSibling (item) 


返回 同 级 的 上 一 个 节点 


GetItemParent(item) 返回 指定 节点 的 父 节点 ID 
ItemHasChildrenCitem) 测试 节点 是 否 有 下 级 节点 
SetItemHasChildren(item, True) 将 指定 节点 设置 为 有 下 级 节点 的 状态 


GetSelection() 


返回 单 选 树 中 当前 被 选中 节点 的 ID 


GetSelections() 


返回 多 选 树 中 所 有 被 选中 节点 ID 的 列表 


SelectItem(item, True/False) 改变 节点 的 选择 状态 
IsSelected(item) 测试 节点 是 否 被 选中 
Delete(item) 删除 指定 ID 的 节点 
DeleteAllItems() 删除 所 有 节点 
DeleteChildren(item) 删除 指定 ID 的 节点 所 有 下 级 节点 
JnsertItem(parent，idPrevious，text) 在 指定 节点 后 面 插入 节点 
InsertItemBefore( parent. index, text) 在 指定 位 置 之 前 插入 节点 
RS 树 形 控 件 的 常用 事件 
fF 说 明 
wx. EVT TREE SEL CHANGING 控件 发 生 选 择 变化 之 前 触发 该 事件 
wx. EVT TREE SEL CHANGED 控件 发 生 选 择 变化 之 后 触发 该 事件 


wx. EVT TREE ITEM COLLAPSING 


收 起 一 个 节点 之 前 触发 该 事件 


wx.EVT_TREE_ITEM_COLLAPSED 


收 起 一 个 节点 之 后 触发 该 事件 


wx. EVT TREE ITEM EXPANDING 


展开 一 个 节点 之 前 触发 该 事件 


wx. EVT TREE ITEM EXPANDED 


展开 一 个 节点 之 后 触发 该 事件 


下 面 的 代码 演示 了 树 形 控件 的 用 法 ,这 个 简单 的 示例 演示 了 增加 根 节 点 、 增 加 子 节点 、 
删除 节点 等 功能 。 
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GUI 


续 表 


import wx 


class TreeCtrlFrame (wx .Frame) : 
def init (self, superion): 

wx.Frame. init (self, parent=superion, title- "TreeCtrl demo', size= (300,400)) 
panel —wx.Panel (self) 
self.tree —wx.TreeCtrl(parent- panel, pos- (5,5), size= (120,200)) 
self.inputString —wx.TextCtrl(parent-panel, pos= (150,10)) 
self.buttonAddChild —wx.Button (parent=panel, label= 'AddChild', pos- (150,90)) 
self.Bind(wx.EVT BUTTON, self.OnButtonAddChild, self.buttonAddChild) 
Self.buttonDeleteNode = wx.Button (parent- panel, label= 'DeleteNode', pos= (150,120)) 
self.Bind(wx.EVT BUTTON, self.OnButtonDeleteNode, self.buttonDeleteNode) 
self.buttonAddRoot =wx.Button (parent=panel, label= 'AddRoot', pos= (150,150) ) 
self.Bind(wx.EVT BUTTON, self.OnButtonAddRoot, self .buttonAddRoot) 


def OnButtonAddChild (self, event): 
itemSelected = self.tree.GetSelection() 
if not itemSelected: 
wx.MessageBox ('Select a Node first.') 
return 
itemString =self.inputString.GetValue() 
self.tree.AppendItem(itemSelected, itemString) 


def OnButtonDeleteNode (self, event): 
itemSelected =self.tree.GetSelection () 
if not itemSelected: 
wx .MessageBox ('Select a Node first.') 
return 
self.tree.Delete (itemSelected) 
def OnButtonAddRoot (self, event): 
rootltem =self.tree.GetRootItem() 
if rootItem: 
wx.MessageBox ('The tree already has a root.') 
else: 
itemString =self.inputString.GetValue () 
self .tree.AddRoot (itemString) 


if name == 


frame -TreeCtrlFrame (None) 
frame.Show() 


app.MainLoop () 
运行 结果 如 图 9-7. 所 示 , 界 面 中 的 文本 框 用 来 输入 节点 显示 的 文本 ,首先 单 击 按钮 
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es Addchild 
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Deleteliode 


AddRoot 插入 根 节 点 ,然后 单 击 选中 根 节点 ,再 单 击 按钮 
AddChild 插入 子 节 点 ,最 后 单 击 选 中 某 个 子 节点 再 单 击 按 
钮 AddChild 为 其 插入 子 节点 。 如 果 单 击 选中 某 个 子 节点 
后 单 击 按钮 DeleteNode 则 可 以 删除 该 节点 。 图 9-7 树 形 控件 用 法 


9.3 Boa-constructor 


Boa-constructor 是 基于 wxPython 开发 的 一 款 优秀 
的 界面 设计 软件 ,同时 也 是 一 款 不 错 的 Python 集成 开发 环境 ,使 用 Boa-constructor 设计 界 
面 时 可 通过 鼠标 调整 控件 的 大 小 和 位 置 ,而 不 用 像 IDLE 那样 完全 依靠 手写 代码 来 创建 和 
控制 界面 。 

登录 http://sourceforge. net/projects/boa-constructor 下 载 Boa-constructor 安装 程序 
后 ,安装 过 程 如 同 其 他 Windows 应 用 程序 一 样 ,无 须 多 做 解释 。 启 动 boa-constructor 时 需 
要 首先 打开 IDLE, 然 后 在 IDLE 中 打开 并 运行 C:\Python27\ Lib\ site-packages\ boa- 
constructor\Boa. py 文件 ,或 者 直接 双击 运行 该 文件 ,当然 也 可 以 在 桌面 或 者 您 更 习惯 的 位 
置 创建 快捷 方式 。 启 动 之 后 的 界面 基本 上 一 目 了 然 ,本 书 不 再 详 述 ,请 大 家 自行 查阅 相关 
资料 。 


本 章 知 识 精 要 


CD wxPython 是 跨 平台 的 GUI 模块 , 除 此 之 外 ,还 可 以 使 用 Python 内 置 的 Tkinter 以 
及 基于 Java 的 Jython 和 支持 .NET 的 IronPython 等 开发 环境 来 支持 GUI 编程 。 

(2) 框架 类 Frame 是 包含 标题 栏 .菜单 按钮 . 单 选 按钮 .文本 框 和 组 合 框 等 其 他 控件 的 
(3) 静态 文本 控件 StaticText 一 般 不 用 来 接受 用 户 的 单 击 、 双 击 等 交互 操作 。 
(4) 按钮 控件 Button 上 显示 的 文本 可 以 通过 SetLabelText() 方 法 动态 改变 ,结合 获取 
文本 的 GetLabelText() 方 法 可 以 让 一 个 按钮 实现 多 个 功能 。 

(5) 下 拉 莱 单 和 弹出 式 菜单 的 菜单 项 事件 处 理 函 数 绑 定 方式 是 一 样 的 。 

(6) 对 话 框 需要 首先 创建 ,然后 显示 对 话 框 , 最 后 再 获取 对 话 框 的 返回 值 。 

(7) 同一 组 中 的 多 个 单 选 按钮 控件 的 选择 是 互 斥 的 ,而 复 选 框 控件 的 选择 不 是 互 斥 的 。 

(8) 树 形 控件 常用 来 显示 有 严格 层次 关系 或 从 属 关系 的 数据 。 


j 88 


1. 设计 一 个 窗 体 ,并 放置 一 个 按钮 , 单 击 按钮 后 弹出 “颜色 ”对 话 框 ,关闭 “颜色 ”对 话 框 
后 提示 选中 的 颜色 。 

2. 设计 一 个 窗 体 , 并 放置 一 个 按钮 ,按钮 默认 文本 为 “开始 ”, 单 击 按钮 后 文本 变 为 “ 结 
东 ”, 再 次 单 击 后 变 为 “开始 ”, 循 环 切换 。 

3. 设计 一 个 窗 体 ,模拟 QQ 登录 界面 , 当 用 户 输 入 号 码 123456 和 密码 654321 时 提示 
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正确 ,否则 提示 错误 。 
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Socket 是 计算 机 之 间 进 行 网 络 通信 的 一 套 程序 接口 ,最 初 由 Berkeley 大 学 研发 ,目前 
已 经 成 为 网 络 编程 的 标准 ,可 以 实现 跨 平台 的 数据 传输 。Socket 是 网 络 通信 的 基础 ,相当 
于 在 发 送 端 和 接收 端 之 间 建 立 了 一 个 管道 来 实现 数据 和 命令 的 相互 传递 。Python 提供 了 
socket 模块 ,对 Socket 进行 了 二 次 封装 ,支持 Socket 接口 的 访问 ,大 幅度 简化 了 程序 的 开 
发 步骤 ,提高 了 开发 效率 。 除 此 之 外 ,Python 还 提供 了 urllib 等 大 量 模块 可 以 对 网 页 内 容 进 
行 读 取 和 处 理 , 在 此 基础 上 结合 多 线程 编程 以 及 其 他 有 关 模 块 可 以 快速 开发 网 页 疏 虫 之 类 的 
应 用 。 可 以 使 用 Python 语言 编写 CGI 程序 ,也 可 以 把 Python 代码 嵌入 到 网 页 中 运行 ,而 借助 
于 web2py 框架 , 则 可 以 快速 开发 网 站 应 用 。 本 章 将 依次 介绍 上 述 几 个 方面 的 应 用 开发 。 


10.1 计算 机 网 络 基础 知识 


为 了 更 好 地 理解 本 章 后 面 的 内 容 , 本 节 首 先 简要 介绍 一 下 计算 机 网 络 的 有 关 概 念 , 如 果 
您 感 兴趣 的 话 可 以 参考 (计算 机 网 络 ) 之 类 的 书籍 以 获取 更 详细 的 知识 。 

CD 网 络 体系 结构 。 目 前 较为 主流 的 网 络 体系 结构 是 ISO/OSI BAF KL A TCP/IP p 
议 族 。 这 两 种 体系 结构 都 采用 了 分 层 设计 和 实现 的 方式 。 例 如 ,ISO/OSI 参考 模型 从 上 而 
下 划分 为 应 用 层 、 表 示 层 、 会 话 层 \ 传 输 层 、 网 络 层 、 数 据 链 路 层 和 物理 层 , 而 TCP/IP 则 将 网 
络 划分 为 应 用 层 、 传 输 层 .网 络 层 和 链 路 层 。 分 层 设 计 的 好 处 是 ,各 层 可 以 独立 设计 和 实现 ， 
只 要 保证 相 邻 层 之 间 的 调用 规范 和 调用 接口 不 变 , 就 可 以 方便 .灵活 地 改变 某 层 的 内 部 实现 
以 进行 优化 或 完成 其 他 需求 。 

(2) 网 络 协议 。 网 络 协议 是 计算 机 网 络 中 进行 数据 交换 而 建立 的 规则 、 标 准 或 约定 的 
集合 。 网 络 协议 的 三 要 素 分 别 为 语法 .语义 和 时 序 。 简 单 地 讲 , 可 以 这 么 理解 ,语义 表示 要 
做 什么 ,语法 表示 要 怎么 做 ,时 序 规定 了 各 种 事件 出 现 的 顺序 。 

O 语法 。 语 法 规定 了 用 户 数据 与 控制 信息 的 结构 与 格式 ,以 及 数据 和 控制 信息 出 现 的 
顺序 。 

@ 语义 。 语义 用 来 解释 控制 信息 每 个 部 分 的 意义 ,规定 了 需要 发 出 何 种 控制 信息 ,以 
及 需要 完成 的 动作 和 做 出 什么 样 的 响应 。 

© 时 序 。 时 序 是 对 事件 发 生 顺 序 的 详细 说 明 ,也 可 称 为 “同步 ”。 

(3) 应 用 层 协议 。 应 用 层 协 议 直接 与 最 终 用 户 进行 交互 ,定义 了 运行 在 不 同 终端 系统 
上 的 应 用 程序 进程 如 何 相 互 传递 报 文 。 下 面 简单 列 出 6 种 常见 的 应 用 层 协议 。 

(D DNS。 域 名 服务 ,用 来 实现 域名 与 IP 地 址 的 转换 。 

@ FTP。 文 件 传输 协议 ,可 以 通过 网 络 在 不 同 平台 之 间 实 现 文件 的 传输 。 

© HTTP。 超 文本 传输 协议 。 

@ SMTP。 简 单 邮件 传输 协议 。 

© ARP. 地址 解析 协议 ,实现 TP 地 址 与 MAC 地 址 的 转换 。 
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TELNET。 远 程 登录 协议 。 

(4) 传输 层 协议 。 在 传输 层 主要 运行 着 TCP 和 UDP 两 个 协议 ,其 中 TCP 是 面向 连接 
的 .具有 质量 保证 的 可 靠 传 输 协 议 , 但 开销 较 大 ;UDP 是 尽 最 大 能 力 传输 的 无 连接 协议 , 开 
销 小 ,常用 于 视频 在 线 点 播 (Video On Demand. VOD) 之 类 的 应 用 。TCP 和 UDP 并 没有 
优 劣 之 分 ,仅仅 是 适用 场合 有 所 不 同 。 在 传输 层 ,使 用 端口 号 来 标识 和 区 分 具体 的 应 用 层 进 
程 ,每 当 创建 一 个 应 用 层 网 络 进程 时 系统 就 会 自动 分 配 一 个 端口 号 与 之 关联 ,是 实现 网 络 上 
端 到 端 通信 的 重要 基础 。 

(5) IP 地 址 。IP 运行 于 网 络 体系 结构 的 网 络 层 ,是 网 络 互 连 的 重要 基础 。IP 地 址 (32 
位 或 128 位 二 进 制 数 ) 用 来 标识 网 络 上 的 主机 ,在 公开 网 络 上 或 同一 个 局 域 网 内 部 ,每 台 主 
机 都 必须 使 用 不 同 的 TP. 地 址 ;而 由 于 网 络 地 址 转换 (Network Address Translation, NAT ) 和 
代理 服务 器 等 技术 的 广泛 应 用 ,不 同 内 网 之 间 的 主机 TP 地 址 可 以 相同 并 且 可 以 互 不 影响 地 正 
常 工 作 。IP 地 址 与 端口 号 共同 来 标识 网 络 上 特定 主机 上 的 特定 应 用 进程 ,俗称 Socket, 

(6) MAC 地 址 。MAC 地 址 也 称 为 网 卡 地 址 或 物理 地 址 ,是 一 个 48 位 的 二 进 制 数 ,用 
来 标识 不 同 的 网 卡 物理 地 址 。 本 机 的 TP 地 址 和 MAC 地 址 可 以 在 命令 提示 符 窗口 中 使 用 
ipconfig/all 命令 查看 ,请 参考 后 面 的 图 10-1. 


10.2 UDP fil TCP 编程 


如 前 所 述 ,UDP 和 TCP 是 网 络 体系 结构 的 运输 层 (也 称 为 传输 层 ) 运 行 的 两 大 重要 协 
议 , 其 中 TCP 适用 于 对 效率 要 求 相对 低 而 对 准确 性 要 求 相 对 高 的 场合 ,例如 文件 传输 、 电 子 
邮件 等 ;而 UDP 适用 于 对 效率 要 求 相对 高 ,对 准确 性 要 求 相对 低 的 场合 ,例如 视频 在 线 点 
播 、 网 络 语音 通话 等 。 在 Python 中 ,主要 使 用 socket 模块 来 支持 TCP 和 UDP 编程 。 


10.2.1 UDP 编程 


UDP 属于 无 连接 协议 ,在 UDP 编程 时 不 需要 首先 建立 连接 ,而 是 直接 向 接收 方 发 送信 
AL, UDP 编程 经 常用 到 的 socket 模块 方法 有 3 个 。 

(1) socket([family[ ,type[ ,proto]]]): 创建 一 个 Socket 对 象 ,其 中 family 为 socket. 
AF INET 表示 IPV4,socket. AF INET6 表示 IPV6;type 为 SOCK STREAM 表示 TCP, 
SOCK DGRAM 表示 UDP. 

(2) sendtoCstring. address) ; 把 string 指定 的 内 容 发 送 给 address 指定 的 地 址 ,其 中 address 
是 一 个 包含 接收 方 主机 TP 地址 和 应 用 进程 端口 号 的 元 组 ,格式 为 (IP 地 址 ,端口 号 ) 。 

(3) recvfromCbufsize[ ,flags]): 接收 数据 。 

下 面 通过 一 个 示例 来 简单 了 解 如 何 使 用 UDP 进行 网 络 通信 。 

【 例 10-1】 编写 UDP 通信 程序 ,发 送 端 发 送 一 个 字符 串 “Hello world!1”。 假 设 接收 端 
在 计算 机 的 5005 端口 进行 接收 ,并 显示 接收 内 容 。 

接收 端 代码 : 

import socket 


s-socket.socket(socket.AF INET, socket.SOCK DGRAM) 


s-bind(("", 5005)) # 空 字符 串 表 示 本 机 任何 可 用 IP 地 址 
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data, addr=s.recvfrom(1024) # 缓 冲 区 大 小 为 1024B 
# 显 示 接 收 到 的 内 容 


print ' received message:$: 


s.close() 
发 送 端 代码 : 


import socket 
s-socket.socket(socket.AF INET, socket.SOCK DGRAM) 
s.sendto("Hello, world!" , ("10.20.52.248" ,5005)) # 假 设 10.20.52.248 是 接收 端 主机 的 IP 地 址 


s.close() 

需要 说 明 的 是 ,在 上 面 的 程序 中 假设 接收 端 主机 IP 地 址 为 10. 20. 52. 248 ,这 很 可 
能 与 您 的 计算 机 配置 不 一 样 ,从 而 导致 运行 结果 与 图 10-2 不 同 。 您 需要 使 用 命令 ipconfig/all 
查看 本 机 IP 地 址 ,如 图 10-1 所 示 ,然后 对 发 送 端 代码 中 的 TP 地 址 进行 相应 修改 。 
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图 10-1 查看 本 机 IP 地 址 
将 上 面 的 代码 分 别 保存 为 receiver. py 和 sender. py, 然 后 需要 首先 在 一 个 命令 提示 符 界面 
中 运行 接收 端 程序 ,这 时 会 发 现 接收 端 程序 处 于 阻塞 接 下 来 启动 男 一 个 命令 提示 符 窗 
口 并 运行 发 送 端 程序 ,此 时 会 看 到 接收 端 程序 继 并 显示 接收 到 的 内 容 , 如 图 10-2 所 示 。 


10.2.2 TCP 编程 


TCP 一 般 用 于 要 求 可 靠 数据 传输 的 场合 。 编 写 TCP 程序 时 经 常 需要 用 到 的 socket 模 
块 的 方法 主要 有 6 个 。 
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(a) 运行 接收 端 程序 ,处 于 阻塞 状态 


ic: \Python2?>sender.py 


Ic: \Python2? 


C:\Python2?> 


(b) 运行 发 送 端 程序 ,接收 端 程序 
图 10-2 UDP 通信 程序 运行 结果 


运行 并 显示 接收 的 内 容 


连接 远程 计算 机 。 
(2) send(bytes[ ,flags]): 发 送 数据 。 
(3) recvCbufsize[ ,flags]) : 接收 数据 。 
(4) bind(address) : 绑 定 地 址 。 
(5) listen(backlog) ; 开始 监听 ,等 待 客户 端 连接 。 
(6) accept) ; 响应 客户 端的 请 求 。 
下 面 通过 一 个 示例 来 演示 如 何 使 用 TCP 进行 通信 。 
【 例 10-2】 TCP 通信 程序 
使 用 TCP 进行 通信 需要 首先 在 客户 端 和 服务 端 之 间 建 立 连 接 , 并 且 要 在 通信 结束 后 关 
闭 连 接 以 释放 资源 。 
客户 端 代码 文件 client. py: 


(1) connect(address) 


import socket 


HOST = '127.0.0.1' # 服务 端 主机 IP 地 址 

PORT = 50007 # 服务 端 主机 应 用 进程 端口 号 
s =socket.socket (socket .AF INET, Socket.SOCK STREAM) 
s.connect((HOST, PORT)) # 建立 连接 
5.sendall(b'Hello, world') # 发 送 数据 

data =s.recv (1024) # 从 服务 端 接收 数据 
s.close() # 关 闭 连接 


print 'Received', repr (data) 
服务 端 代 码 文件 server. py: 


import socket 
HOST ="" # 本 机 所 有 可 用 IP 地 址 
PORT = 50007 


s —socket.socket(socket.AF INET, socket.SOCK STREAM) 


s.bind((HOST, PORT)) # 绑 定 Socket 
s.listen(1) # 开 始 监听 


print 'Listening at port:',PORT 
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conn, addr =s.accept () 
print 'Connected by', addr 
while True: 
data —conn.recv (1024) 
if not data: 
break 
conn.sendall (data) 


conn.close () 


将 上 面 两 段 代 码 分 别 保存 为 client. py 和 server. py X ff. 一 个 命令 提示 jeg H. 
行 服务 端 程序 开始 监听 ,如 图 10-3(a) 所 示 ; 然 后 再 启动 一 个 命 (gum 符 窗口 并 运行 客户 端 
程序 ,向 服务 端 发 送 数据 ,服务 站 这 收 到 数据 后 向 客户 端 回 复数 据 ,如 图 10-3( it 多 
iz 111 55 3 和 客户 端 程序 可 以 发 现 ,服务 端 程 上 先 设置 的 固定 端口 监听 ,而 
客户 端 每 次 连接 时 所 使 用 的 端口 却 是 变化 的 ,如 图 10-3(c) 所 示 


次 


g at port: 58007 


(a) 启动 服务 端 开始 监听 


ython lient-py 
eived ’Hello, world’ 


(b) 运行 客户 端 程序 


a - [5] || 


client -py 
Hello, world’ 


(c) 多 次 运行 服务 端 和 客户 端 程序 
图 10-3 TCP 通信 程序 运行 结果 
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10.3 简单 噢 探 器 实现 


嗅 探 器 程序 可 以 检测 和 监控 本 机 所 在 局 域 网 内 的 网 络 流量 和 所 有 数据 包 , 对 于 网 络 管 
理 来 说 具有 重要 作用 。 为 了 实现 网 络 流量 嗅 探 ,需要 将 网 卡 设置 为 混杂 模式 ,下 面 程序 的 运 
行 需 要 获得 管理 员 权限 。 


import socket 
#the public network interface 

HOST = socket .gethostbyname (socket .gethostname () ) 

# create a raw socket and bind it to the public interface 

s —socket.socket(socket.AF INET, socket.SOCK RAW, socket.IPPROTO IP) 
s.bind( (HOST, 0)) 

# include IP headers 

s.setsockopt (socket.IPPROTO IP, socket.IP HDRINCL, 1) 

# receive all packages 

s.ioctl(socket.SIO RCVALL, socket.RCVALL ON) 

# receive a package 

print (s.recvfrom(65565)) 

# disabled promiscuous mode 

S.ioctl(socket.SIO RCVALL, socket.RCVALL OFF) 


10.4 网 页 内 容 读 取 


在 Python 2 中 提供 了 urllib 和 urllib2 两 个 模块 用 来 支持 网 页 内 容 读 取 ,在 Python 3 
中 对 这 两 个 模块 进行 了 整合 ,只 提供 urllib 一 个 模块 。Python 2 中 的 urllib 模块 在 Python 
3 中 被 分 成 了 urllib. request, urllib. parse 和 urllib. error 三 部 分 , 目前 只 支持 HTTP 
(versions 0. 9 and versions 1.0), FTP 和 local files 3 种 协议 。urllib2 模块 在 Python 3 中 
则 被 合并 到 了 urllib. request 和 urllib. error 中 。 


10.4.1 urllib 


该 模块 提供 了 大 量 方法 ,具体 列表 可 以 导入 urllib 模块 之 后 使 用 dirO 函数 来 查看 ,并 
使 用 helpO 〇 函数 来 获取 特定 函数 的 详细 帮助 文档 。 本 节 主 要 通过 几 个 示例 来 简单 演示 该 
模块 的 用 法 。 

下 面 的 Python 2.7. 8 代码 用 来 输出 指定 网 页 的 内 容 : 


>>> import urllib 
>>> £ =urllib.urlopen ('http://www.python.org') 
>>>print £.read() 

>>> £.close() 


在 Python 3. 4. 2 中 上 面 的 代码 应 替换 为 下 面 的 代码 ,后 面 的 几 个 示例 与 此 类 似 ,请 自 
行 查阅 帮助 文档 进行 正确 的 蔡 换 。 
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>>> import urllib.request 
»»»dir(urllib.request) 

>>> fp -urllib.request.urlopen ('http://www.python.org') 
>>>dir (fp) 

>>>print (fp. read (100) ) 


>>> fp.close () 
下 面 的 Python 2. 7. 8 代码 使 用 GET 方法 提交 参数 并 访问 指定 页 面 : 


»»»import urllib 

»»»params -urllib.urlencode (('spam': 1, 'eggs': 2, 'bacon': 0}) 

>>> f -urllib.urlopen ("http://www.musi- cal.com/cgi- bin/query?*s" $params) 
>>>print f.read() 


下 面 的 Python 2. 7. 8 代码 使 用 POST 方法 提交 参数 并 访问 指定 页 面 : 


»»»import urllib 
>>> params =urllib.urlencode({'spam': 1, 'eggs': 2, 'bacon': 0}) 
>>> f =urllib.urlopen ("http://www.musi- cal.com/cgi- bin/query", params) 


>>>print f.read() 
下 面 的 Python 2.7. 8 代码 使 用 HTTP 代理 访问 指定 网 页 : 


>>> import urllib 

»»»proxies = ('http': 'http://proxy.example.com:8080/'] 
>>> opener -urllib.FancyURLopener (proxies) 

>>> f =opener.open ("http: / /www python .org") 
»»»f.read() 


10.4.2 其 他 可 能 用 到 的 模块 


除了 urllib 模块 之 外 ,在 实际 开发 中 可 能 还 需要 结合 其 他 有 关 模 块 来 实现 特定 的 需求 ， 
下 面 列 出 了 其 中 6 个 。 

(1) cookielib; 提供 了 可 存储 和 操作 cookie 的 对 象 与 方法 ,以 便于 与 urllib 模块 配合 使 
用 来 访问 Internet 资源 。 

(2) httplib: 是 相对 底层 的 HTTP 请 求 处 理 模块 ,不 如 urllib 模块 封装 的 层次 高 ,但 能 
够 更 加 灵活 地 对 通信 进行 控制 。 

(3) beautifulSoup: 使 用 Python 实现 的 一 个 HTML/XML 的 解析 器 ,可 以 很 好 地 处 理 
不 规范 标记 并 生成 剖析 树 (parse tree). 

(4) Scrapy: 使 用 Python 实现 的 一 个 快速 高 层 的 屏幕 抓 取 和 Web 抓 取 框架 ,用 于 抓 
取 Web 站 点 并 从 页 面 中 提取 结构 化 的 数据 。Scrapy 用 途 非 常 广泛 ,可 以 用 于 数据 挖掘 、 监 
测 和 自动 化 测试 等 。 

(5) json、BeJson: 轻 量 级 数据 交换 格式 ,易于 阅读 和 编写 ,同时 也 易于 机 器 解析 和 生 
成 ,使 用 该 格式 可 以 提高 网 络 传输 速度 。 

(6) rsa: 密码 模块 ,可 以 用 来 结合 urllib 模块 实现 某 些 网 站 或 论坛 的 模拟 登录 。 
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10.5 使 用 Python 开发 网 站 


Python 是 一 门 脚本 语言 ,完全 可 以 像 PHP, VBScript 等 脚本 语言 一 样 用 来 开发 网 页 以 
及 CGI 程序 。 既 可 以 直接 编写 Python 脚本 程序 来 生成 网 页 ,也 可 以 把 Python 程序 嵌入 
.asp 文件 ,无 论 使 用 哪 种 方式 ,都 可 以 使 用 服务 器 上 已 安装 的 所 有 Python 扩展 模块 ,同时 
也 要 遵守 缩 进 以 及 其 他 格式 要 求 , 如 同 编写 Python 程序 一 样 。 在 Windows 平台 上 ,为 了 能 
ik IIS 运行 Python 程序 ,需要 完成 以 下 几 步 设置 。 

(1) 设置 IIS 中 网 站 属性 ,重点 是 TCP 端口 号 的 设置 ,这 里 设置 为 8080, 如 图 10-4 所 示 。 


I BEER sare 
[73 ISAPI mikes | SBR | xs | 目录 安全 性 


SEG UR 


IP Hitt ©) GEAR 国 (emo... 
TC 端口 中 ) |8080 SSL CH 


连接 超时 QD. 900| 秒 
回 保持 rr 连接 00 
回 局 用 日 志 记录 到) 


活动 日 志 格式 Q0 : 
woe 扩展 日 志文 件 格式 


[wx J( x& (saw ]( wb jJ 
图 10-4 “网 站 ”选项 卡 
(2) 创建 网 站 或 虚拟 目录 ,设置 别名 ,这 里 以 Python 为 例 ,如 图 10-5 所 示 。 


"2 Internet 信息 服务 
XED MEO BW MOD 
eo © FOR @B2>an 
WB Internet 信息 服务 ^| £f 
B B) mesa: (二 地 计算 机 ) | Brien 
日 四 网 站 
ca BUR 虚拟 目录 创建 向 导 
susra | pmarae 
Sáb -rti-hin | 必须 为 虚拟 目录 提供 一 个 简短 的 名 称 或 别 各 ,以 便于 快速 引用 。 


[A V: A 上 录 访 问 权限 的 别 各。 使 用 的 命名 规 


«1-5 OFF > 


图 10-5 创建 虚拟 目录 
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(3) 接 下 来 为 刚才 创建 的 网 站 或 虚拟 目录 设置 目录 , 即 包 含 Python f&)T sk Vj fit 


Python 代码 的 . asp 文件 的 目录 ,如 图 10-6 所 示 。 


`i Internet 信息 服务 
XO BEO 查看 WD 帮助 如 
e om sfo eME »mru 
D internet 信息 服务 
p iii Tsala 
20 网 站 
eium NSE Fol 
a IISMelp 
gg v in 


图 10-6 设置 目录 


(4) 打开 网 站 属性 界面 ,设置 脚本 访问 权限 ,如 图 10-7 所 示 。 


[SHER [文档 azeet ar 头目 定义 错误 ] 
连接 允许 源 时 的 内 容 来 源 
Oxi LAR Q 
加 另 一 台 计 算 机 上 的 共享 O) 
ORAH mw 


EME ©: — [C:\Python27\wre ko) 


回 脚 本 资源 访问 © 回 记录 访问 中) 
[oit an 加 索引 资源 中 


应 用 程序 名 W Python LT] 
开始 位 置 : RUPE Python 

ATRD: 脚本 和 可 执行 文件 ~ m omm) 
RRP OD: [PC gi veo | 


确定 LI] EAW ELJ 
107 设置 权限 


最 后 单 击 “* 配 置 ? 按 钮 ,在 弹出 来 的 “映射 ?选项 卡 中 单 击 * 添 加 ?按钮 ,然后 填写 可 执行 文 


件 以 及 扩展 名 来 设置 Python 程序 的 映射 关系 ,如 图 10-8 所 示 。 
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(5) 编写 Python 程序 index. py, 并 保存 在 上 面 设置 的 目录 中 。 


print 
print 'Status: 200 OK" 
print 'Content- type: text/html' 


网 络 程序 


添加 /编辑 应 用 程序 扩展 名 映射 


可 执行 文件 0) (C \Python27\python. exe %s Xs [or o»... 

FREQ: py 
动作 
Oat) 
OBS QD: 


回复 本 引擎 O 


回 检查 文件 是 否 存在 C) Cae) 


(Lws ][ Es J| sew C] 


图 10-8 设置 Python 程序 映射 关系 


Print 

print '<html><head><title> Python Sample CGI< /title»« /head» ' 
print '<body>' 

print '«hl» This is a header« /hl» ' 

print '«p»note:this is only a test." 

print '<br>' 

print '</body>' 


(6) 使 用 浏览 器 访问 刚才 创建 的 网 站 ,如 图 10-9 所 示 。 


< > Q ft x 9 htp://127.0.0.1:8080/Python/ndex.py 
Oste 加 上 网 级 Cuumeo 


his is a header 


ote:this is only a test. 


10-9 使 用 Python 编写 CGI 程序 


下 面 的 代码 演示 了 在 . asp 文件 中 内 内 Python 代码 的 用 法 : 


< S@LANGUAGE= Pythongs> 

<html> 

<head> < /head> 

<body> 

«h1» Python Test« /h1» 

<% 

import math 

s =math. sqrt (9) 

Response.Write ("Python Test«br» ') 
Response.Write (str (s) ) 
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Response.write('«h3» Smaller heading< /hr» ') 

=> 

</body> 

</html> 

将 上 面 的 代码 保存 为 indexl. asp 文件 ,并 放置 于 前 面 在 TIS 中 设置 的 目录 C:\ 
Python27\www 中 ,通过 浏览 器 访问 该 网 页 ,结果 如 图 10-10 所 示 。 


口 http://localhost:8080/Pythor 
C € QW & htp://locahost-8080/Python/ndex1.asp 
Osise (OG rmsm Cumeo 


Python Test 


Python Test 
3. 0 


Smaller heading 


图 10-10 AH Python 代码 的 . asp 网 页 


10.6 使 用 web2py 框架 开发 网 站 


Zope2, Web. py, Pyramid, CubicWeb, Django 和 web2py 是 目前 比较 流行 的 支持 
Python 的 网 站 开发 框架 。 尽 管 每 个 框架 都 有 自己 的 特色 和 独到 之 处 ,但 其 中 用 户 推荐 度 较 
高 的 当 属 web2py, 该 框架 中 集成 了 用 户 认证 ,数据 库 操作 ,模板 系统 和 Form 表单 等 大 量 功 
能 组 件 , 能 够 完成 开发 中 的 常用 功能 。 开 发 者 通过 组 合 不 同 的 功能 组 件 , 再 加 上 自己 实现 的 
业务 逻辑 ,就 像 搭 积木 一 样 来 快速 开发 Web 应 用 。 

本 节 以 web2py 框架 为 例 介绍 网 站 开发 流程 。web2py 框架 使 用 MVC 模式 实现 网 站 
开发 , 即 Model-View-Controller 模式 。 其 中 M 指 模型 , 即 存储 在 数据 库 中 的 待 处 理 数据 ; 
V 指 视图 ,用 来 决定 数据 的 显示 形式 ;C 指控 制 , 即 负责 处 理 用 户 请 求 ,根据 特定 的 业务 逻辑 
对 模型 中 的 数据 进行 修改 并 将 新 的 结果 视图 返回 给 最 终 用 户 。 使 用 web2py 框架 开发 Web 
应 用 的 流程 : 首先 定义 模型 ,然后 编写 控制 逻辑 ,最 后 实现 视图 ,将 数据 以 特定 的 形式 展示 
给 最 终 用 户 。 

您 可 以 登录 web2py 框架 官方 主页 (http://web2py. com) 下 载 适合 您 的 压缩 包 , 解 压缩 
后 找到 并 执行 web2py. exe 文件 ,会 看 到 一 个 黑色 的 命令 提示 符 窗 口 和 web2py 框架 的 主 窗 
O ,选择 服务 器 的 TP 地 址 .设置 服务 器 端口 号 和 密码 之 后 , 单 击 start server 按钮 即 可 启动 
web2py 框架 并 打开 web2py 的 欢迎 界面 , 单 击 页 面 右 侧 的 administrative interface 进入 管 
理 员 页 面 , 分 别 如 图 10-11 和 图 10-12 所 示 。 

在 web2py 中 每 一 个 网 站 都 是 一 个 应 用 或 者 APP ,默认 有 admin, examples 和 welcome 
3 个 应 用 ,如 图 10-12 所 示 。 如 果 需 要 创建 自己 的 应 用 ,可 以 在 图 10-12 中 页 面 右 侧 输入 要 
创建 的 应 用 名 称 然后 单 击 create 按钮 ,然后 即 可 自动 跳 转 到 相应 应 用 的 设计 与 开发 界面 。 
下 面 我 们 通过 一 个 例子 来 演示 使 用 web2py 开发 Web 应 用 的 流程 ,要 求 网 站 运行 后 接收 用 
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beb2py Web Fra 
created by Mass Pierro, Copyright 
-12-stable+t inestamp.2015 .61.1 


available: sqlite3, pynysq 


Local (IPv4) (127.0.0.1) 
Local Q6) C:1) 
Public (10.20.52.248) 
Public (169.254.210.171) 
Public (0.0.0.0) 


e 


Server Port (6000 


Choose Password: ree 


start server 


图 10-11 web2py 启动 界面 


ZE + 
«»com htp://122.00.1 ale*tüsxe 
PA 


Grmsm Ampe 


web2py™ administrative interface 


WP aamin (currently running) Manage v 


Manage" Disave able+timeatamp 


(Running on Rocket 1.26, Python 2.7.6) 


Manage» Disable 


New simple application 


Application name 


eate 


Upload and install packed application 


Appication name: 


Upload a package 


Or Get mom URL 


图 10-12 web2py 管理 员 页 面 


189 


(Python #2Frizit) 第 10 章 


户 输入 的 整数 , 单 击 按钮 以 后 判断 该 整数 是 否 为 素数 ,并 给 出 结果 。 更 多 详细 资料 请 登录 
web2py 官方 网 站 进行 查阅 。 

(1) 首先 在 web2py 管理 员 界 面 中 右 侧 文本 框 中 输入 IsPrime, 然 后 单 击 create 按钮 , 进 
入 IsPrime 应 用 的 设计 开发 界面 ,如 图 10-13 所 示 。 


+ 
< C € M s http://127.0.0.1:8000/a faut/design/IsP 
Osat ”图 上 网 S 航 ”人 应 用 中 心 
REESE graph model 
[M 
[Miri 
create 
控制 器 se 
测试 定期 事务 
EM n RE 
[ e ae 
create 
视图 e 
Download layouts from repository 
修改 Fa 
in) 扩展 layouthtml 
EM Fa 扩展 layout.html 
wa Fy 扩展 layouthtml 
Bm Py 扩展 layout.htmi 
[M 


10-13 web2py 的 应 用 设计 开发 界面 


(2) 单 击 控制 器 一 栏 下 方 的 create 按钮 ,然后 输入 IsPrime 并 再 次 单 击 下 面 的 create TZ 
钮 , 即 可 看 到 新 创建 的 文件 IsPrime. py, 如 图 10-14 所 示 。 


控制 器 se 
mio 定期 事务 
WEE FR Fe sprme py RÆ index 
Ld 5 p rt, download, csv, select, updal 
oa) Fe dex, user, download, call, api 
create 


图 10-14 创建 控制 器 文件 
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修改 IsPrime. py 文件 内 容 , 编 写 下 面 的 代码 : 


#- * coding: utf-8- * - 
def index(): 
form —FORM(INPUT( name- 'number', requires- IS NOT EMPTY()),\ 
INPUT( type- 'submit')) 
if form.process () .accepted: 
num = int (form.vars.number) 
for i in range (2,num) : 
if num$i ==0: 
session.r = 'No' # 设 置 会 话 变量 
redirect (URL ('result')) # 重 定向 至 result.html 
else: 
session.r = 'Yes' 
redirect (URL ('result')) 
return dict (form- form) 
def result(): 
r =session.r or redirect (URL ('index')) 


return dict (r=r) 
(3) 在 视图 下 面 使 用 create 按钮 分 别 创建 index 和 result 两 个 视图 文件 ,内 容 如 下 ,其 
中 两 对 大 括号 “{{ ))” 中 是 Python 代码 。 
index. html 文件 内 容 : 


{{extend 'layout.html]) 
{{= form}} 


result. html 文件 内 容 : 


{{extend 'layout.html']] 

«hl» {{= session.r or 'Unknown'}}< /hl> 

然后 在 地 址 栏 中 输入 地 址 http://127. 0. 0. 1:8000/IsPrime/isprime/index, 7E X% HE 
内 输入 一 个 整数 , 单 击 旁 边 的 按钮 ,页 面 显示 该 整数 是 否 为 素数 ,如 图 10-15 和 图 10-16 
所 示 。 

在 web2py 解压 缩 目 录 的 applications 子 目 录 中 可 以 找到 新 建 的 IsPrime 应 用 的 所 有 文 
件 ,在 其 中 的 views 子 目录 中 有 相应 的 视图 文件 ,其 中 layout. html 文件 是 web2py 自 带 的 
页 面 样式 ,可 以 根据 自己 喜欢 的 风格 和 样式 进行 修改 。 

最 后 再 给 出 几 个 简单 的 示例 ,可 以 通过 web2py 框架 创建 应 用 并 运行 。 

1. 显示 字符 串 

控制 器 代码 (template_examples. py): 


def test for(): 
return dict () 


视图 代码 (template_examples/test_for. html) : 


{{extend 'layout.html']] 
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| http://127.0.0.1 


INPUT 


web2py™ 


IsPrime 


Index 


提交 查询 内 容 


图 10-15 index 页 面 


< com http://127.0.0.1 


INPUT 


web2py™ 


IsPrime 


Result 


Yes 


图 10-16 result 页 面 


<hl>For loop< /hl> 

{{for number in ['one', 'two', 'three']:}} 
<h2> ( (2 number.capitalize () }}< /h2> 
{{pass}} 

2. 以 超 链接 方式 显示 指定 网 址 

控制 器 代码 (template_examples. py) : 


def test def(): 
return dict () 


视图 代码 (template_examples/test_def. html) : 


{{extend 'layout.html'])] 
{{def itemlink (name) :}}< li» ((-A (name, _href=name) }}< /1i> {{return}} 


网 络 程序 设计 


«ul» 
{{itemlink ("http: //www.google.com') }} 
{{itemlink{('http://www. yahoo.com") }} 
{{itemlink('http://www.nyt.com") }} 
</ul> 

3. 显示 变量 值 

控制 器 代码 (template_examples. py) : 


def variables(): 
return dict (a=10, b=20) 


视图 代码 (template_examples/variables. html) : 


{{extend 'layout.html']) 
<hl> Your variables< /hl» 
<h2>a= {{=a}}< /h2> 
<h2>a= { {=b} }< /h2> 


本 章 知 识 精 要 


CD IP 地 址 和 端口 号 共同 来 标识 网 络 上 特定 主机 上 的 特定 应 用 进程 , 称 为 Socket, 

(2) TCP 适用 于 对 效率 要 求 较 低 而 对 准确 性 要 求 较 高 的 场合 ,是 面向 连接 .具有 服务 
质量 保证 的 可 靠 传输 协议 ,而 UDP 属于 无 连接 协议 ,可 能 会 发 生 丢 包 或 其 他 错误 ,适用 于 
视频 在 线 点 播 、 网 络 语音 通信 之 类 的 场合 。 

(3) urllib 模块 提供 了 大 量 对 象 和 方法 支持 网 页 内 容 读 取 , 结 合 密码 模块 以 及 多 线程 编 
程 可 以 轻松 实现 网 络 息 虫 程序 。 

(4) 既 可 以 使 用 Python 编写 CGI 程序 来 动态 生成 网 页 ,也 可 以 把 Python FRY HA. 
.asp 文件 。 

(5) fE Windows 平台 上 使 用 IIS 运 行 Web 应 用 时 需要 配置 映射 关系 来 支持 Python 程 
序 的 解释 和 执行 。 

(6) web2py 框架 集成 了 用 户 认 证 ,数据库 操作 和 模板 系统 等 大 量 功能 组 件 以 支持 Web 
开发 。 


局 


题 


l. 简单 解释 TCP 和 UDP 的 区 别 。 

2. 同学 之 间 合 作 编 写 UDP 通信 程序 ,分 别 编写 发 送 端 和 接收 端 代码 ,发 送 端 发 送 一 个 
字符 串 “Hello world!”。 假 设 接收 端 在 计算 机 的 5000 端口 进行 接收 ,并 显示 接收 内 容 。 

3. 简单 介绍 socket 模块 中 用 于 TCP 编程 的 常用 方法 。 

4. 编写 代码 读 取 搜 狐 网 页 首页 内 容 。 

5. 在 自己 的 机 器 上 配置 TIS 以 支持 Python 脚本 的 运行 ,然后 使 用 Python 编写 脚本 ， 
运行 后 在 网 页 上 显示 “Hello world!” 
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第 11 章 大 数据 处 理 


相信 大 家 已 经 很 明显 地 感觉 到 ,这 是 一 个 信息 量 极 度 膨胀 的 时 代 , 大 数据 的 概念 自从 提 


出 来 以 后 


,迅速 渗透 到 各 行 各 业 。 那 么 到 底 什 么 是 大 数据 呢 ? 历 史上 有 个 著名 的 故事 叫 “ 草 


故事 的 主人 公 诸 万 亮 对 天 象 的 观察 实际 上 就 是 对 风云 .温度 、 湿 度 、 光 照 和 所 处 节 


气 等 大 量 多 元 化 的 非 结 构 数据 进行 综合 分 析 , 最 终 通 过 复杂 的 计算 得 出 了 正确 的 结论 并 为 
最 终 决策 提供 了 有 力 支持 ,这 可 以 看 作 是 大 数据 的 一 个 经 典 应 用 。 下 面 引用 网 上 一 则 小 故 
事 ,也许 对 您 理解 大 数据 有 所 帮助 。 

某 比萨 店 的 电话 铃 响 了 ,客服 人 员 拿 起 电话 。 


客服 
顾客 
客服 


顾客 : 


客服 


搭桥 手 
顾 
客 


X 
LANE PE PESEESE. 


: 这 是 XX XX 比萨 店 。 您 好 ,请 问 有 什么 需要 我 为 您 服务 ? 

: 你 好 ,我 想 要 一 份 …… 

: 先生 ,请 先 把 您 的 会 员 卡号 告诉 我 。 

16846146xxx。 

: 陈 先生 ,您 好 ! 您 是 住 在 泉州 路 一 号 12 楼 1205 室 ,您 家 电话 是 2646xxxx, 您 公 


L 4666xxxx, 您 的 手机 是 1391234xxx*。 请 问 您 想 用 哪 一 个 电话 付费 ? 


: 你 为 什么 知道 我 所 有 的 电话 号 码 ? 

: 陈 先生 ,因为 我 们 联机 到 CRM 系统 。 

: 我 想 要 一 个 海鲜 比萨 …… 

: 陈 先生 ,海鲜 比萨 不 适合 您 。 

: 为 什么 ? 

: 根据 您 的 医疗 记录 ,你 的 血压 和 胆固醇 都 偏 高 。 

: 那 你 们 有 什么 可 以 推荐 的 ? 

: 您 可 以 试 试 我 们 的 低 脂 健康 比萨 。 

: 你 怎么 知道 我 会 喜欢 吃 这 种 的 ? 

: 您 上 星期 一 在 中 央 图 书馆 借 了 一 本 《 低 脂 健康 食谱 》。 

: 好 。 那 我 要 一 个 家 庭 特大 号 比萨 ,要 付 多 少 钱 ? 

: 99 元 ,这 个 足够 您 一 家 六 口吃 了 。 但 您 母亲 应 该 少 吃 ,她 上 个 月 刚刚 做 了 心脏 
: 那 可 以 刷卡 吗 ? 

: 陈 先生 ,对 不 起 。 请 您 付 现款 ,因为 您 的 信用 卡 已 经 刷 爆 了 ,您 现在 还 欠 银 行 


4807 元 ,而 且 还 不 包括 房贷 利息 。 


= 


顾客 
客服 
顾客 
客服 
顾客 


: 那 我 先 去 附近 的 提 款 机 提 款 。 

: 陈 先生 ,根据 您 的 记录 ,您 已 经 超过 今日 提 款 限额 。 

: 算 了 ,你 们 直接 把 比萨 送 我 家 吧 ,家 里 有 现金 。 你 们 多 久 会 送 到 ? 
: KA 30 分 钟 。 如 果 您 不 想 等 ,可 以 自己 骑 车 来 。 

: 为 什么 ? 


大 数据 处 理 


客服 : 根据 我 们 CRM 全 球 定位 系统 的 车 辆 行驶 自动 跟踪 系统 记录 。 您 登记 有 一 辆 车 
号 为 SB-748 的 摩托 车 ,而 目前 您 正在 解放 路 东 段 华 联 商 场 右 侧 骑 着 这 辆 摩托 车 。 

顾客 当即 晕 倒 …… 

现 如 今 , 大 数据 的 应 用 比比 皆 是 ,为 各 行 各 业 都 带 来 了 巨大 商机 ,也 提供 了 重要 的 决策 
支持 ,请 看 下 面 的 例子 。 

(1) 洛杉矶 警察 局 和 加 利 福 尼 亚 大 学 合作 利用 大 数据 预测 犯罪 的 发 生 。 

(2) Google 流感 趋势 (Google Flu Trends) 利 用 搜索 关键 词 预测 禽 流 感 的 散布 。 

(3) 统计 学 家 内 特 。 西 尔 弗 (Nate Silver) 利 用 大 数据 预测 了 2012 年 美国 选举 结果 。 

(4) 麻 省 理工 学 院 利用 手机 定位 数据 和 交通 数据 建立 城市 规划 。 

(5) 梅 西 百货 的 实时 定价 机 制 。 根 据 需求 和 库存 的 情况 ,该 公司 基于 SAS 的 系统 对 多 
达 7300 万 种 货品 进行 实时 调价 。 

(6) Tipp24 AG 针对 欧洲 博彩 业 构 建 的 下 注 和 预测 平台 。 该 公司 用 KXEN 软件 来 分 
析 数 十 亿 计 的 交易 以 及 客户 的 特性 ,然后 通过 预测 模型 对 特定 用 户 进行 动态 的 营销 活动 。 
这 项 举措 减少 了 90% 的 预测 模型 构建 时 间 。SAP 公司 正在 试图 收购 KXEN。SAP 想 通过 
这 次 收购 来 扭转 其 长 久 以 来 在 预测 分 析 方 面 的 劣势 。 

(7) 沃尔玛 的 搜索 。 这 家 零售 业 守 头 为 其 网 站 自行 设计 了 最 新 的 搜索 引擎 Polaris. Fil 
用 语义 数据 进行 文本 分 析 、 机 器 学 习 和 同义词 挖掘 等 。 根 据 沃 尔 玛 负 责 人 的 说 法 ,语义 搜索 
技术 的 运用 使 得 在 线 购物 的 完成 率 提升 了 10% 一 15%。“ 对 沃尔玛 来 说 ,这 就 意味 着 数 十 
亿美 元 的 金额 。” 

(8) 快餐 业 的 视频 分 析 。 该 公司 通过 视频 分 析 等 候 队 列 的 长 度 ,然后 自动 变化 电子 菜 
单 显示 的 内 容 。 如 果 队 列 较 长 , 则 显示 可 以 快速 供给 的 食物 ;如 果 队 列 较 短 , 则 显示 那些 利 
润 较 高 但 准备 时 间 相对 长 的 食品 。 

目前 在 学 术 界 公认 的 大 数据 四 大 特征 如 下 。 

CD 数据 量 巨 大 。 从 TB 级 别 跃 升 到 PB 级 别 甚 至 EB、ZB 级 别 。 

(2) 数据 类 型 繁多 。 非 结构 化 数据 越 来 越 多 ,例如 网 络 日 志 、 视 频 、 图 片 和 地 理 位 置信 
息 等 ,这 对 数据 处 理 能 力 提出 了 更 高 的 要 求 。 

(3) 价值 密度 低 。 例 如 ,在 一 个 小 时 连续 不 间断 的 监控 视频 中 ,真正 有 用 的 数据 很 可 能 
只 有 几 秒 钟 。 如 何 通 过 强大 的 机 器 和 高 效 的 算法 更 迅速 地 完成 数据 的 价值 “提纯 ”, 成 为 目 
前 大 数据 背景 下 吸 待 解决 的 难题 和 重要 的 研究 热点 之 一 。 另 外 ,数据 的 来 源 直 接 导 致 分 析 
结果 的 准确 性 和 真实 性 。 若 数据 来 源 是 完整 的 并 且 是 真实 的 ,最 终 的 分 析 结 果 以 及 决定 将 
更 加 准确 。 

(4) 要 求 处 理 速度 快 。 根 据 IDC 的 “数字 宇宙 ”的 报告 ,预计 到 2020 年 ,全 球 数据 使 用 
量 将 达到 35. 2ZB。 可 以 说 ,在 如 此 海量 的 数据 面前 ,处 理 数 据 的 效率 就 是 企业 的 生命 。 


11.1 大 数据 框架 
Amazon、Google 等 很 多 大 公司 都 推出 了 自己 的 大 数据 框架 和 服务 ,这 里 简单 介绍 较为 


经 典 和 流行 的 MapReduce, Hadoop 和 Spark, JAE 11. 2 W MapReduce 为 例 介 绍 大 数 
据 处 理 的 思路 和 具体 应 用 。 
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1. MapReduce 

分 布 式 计算 框架 ,可 以 将 单个 大 型 计算 作业 分 配给 多 台 计 算 机 执行 ,可 以 在 短 时 间 内 完 
成 大 量 工作 ,尤其 适合 数值 型 和 标 称 型 数据 ,但 需要 对 行业 领域 具有 一 定理 解 后 重 写 算法 来 
完成 特定 的 业务 处 理 要求 。MapReduce 的 名 字 由 函数 式 编程 中 常用 的 map 和 reduce 两 个 
单词 组 成 。MapReduce 在 大 量 节点 组 成 的 集群 上 运行 ,工作 流程 : 单个 作业 被 分 成 很 多 小 
份 ,输入 数据 也 被 切片 并 分 发 到 每 个 节点 ,每 个 节点 只 在 本 地 数据 上 做 运算 ,对 应 的 运算 代 
码 称 为 Mapper, 这 个 过 程 即 map 阶段 ;每 个 Mapper 的 输出 通过 某 种 方式 组 合 , 根 据 需要 可 
能 再 进行 重新 排序 ,排序 后 的 结果 再 被 切 分 成 小 份 并 分 发 到 各 个 节点 进行 下 一 步 处 理 ,这 个 
过 程 称 为 reduce 阶段 ,对 应 的 代码 称 为 Reducer。 不 同类 型 的 作业 可 能 需要 不 同 数量 的 
Reducer, 并 且 , 在 任何 时 候 ,每 个 Mapper 或 Reducer 之 间 都 不 进行 通信 ,每 个 节点 只 负责 
处 理 自己 的 事务 ,并 且 只 在 分 配 到 本 地 的 数据 集 上 进行 运算 。 

2. Hadoop 

Hadoop 是 MapReduce 框架 的 一 个 免费 开源 实现 ,采用 Java 语言 编写 ,支持 在 大 量 机 
器 上 分 布 式 处 理 数据 。 除 了 分 布 式 计算 之 外 ,Hadoop 还 自 带 分 布 式 文件 系统 ,可 以 在 上 面 
运行 多 种 不 同 语言 编写 的 分 布 式 程序 。Hadoop 在 可 伸缩 性 、 健 壮 性 .计算 性 能 和 成 本 上 具 
有 无 可 替代 的 优势 ,事实 上 已 成 为 当前 互联 网 企业 主流 的 大 数据 分 析 平 台 。 

3. Spark 

Spark 是 一 个 针对 超大 数据 集合 的 低 延 迟 集群 分 布 式 计算 系统 , 比 MapReduce tk 40 
信 左 右 。Spark 是 Hadoop 的 升级 版 本 ,兼容 Hadoop 的 API, 能 够 读 写 Hadoop 的 HDFS 
HBASE 顺序 文件 等 ,与 之 不 同 的 是 将 结果 保存 在 内 存 中 。Hadoop 作为 第 一 代 产 品 使 用 了 
HDFS, 第 二 代 加 入 了 Cache 来 保存 中 间 计 算 结果 ,第 三 代 则 是 Spark 倡导 的 流 技术 


Streaming, 


11.2 MapReduce 编程 案例 


MapReduce 编程 思路 非常 简单 ,首先 对 大 数据 进行 分 割 , 切 分 为 一 定 大 小 的 数据 ;然后 
将 分 割 的 数据 交 给 多 个 Mapper 函数 进行 处 理 ,Mapper 函数 处 理 后 将 产生 一 组 规模 较 小 的 
数据 ,多 个 规模 较 小 的 数据 再 提交 给 Reducer 函数 进行 处 理 , 得 到 一 个 更 小 规模 的 数据 或 最 
终结 果 。 对 于 不 同 的 具体 应 用 ,需要 根据 特定 的 要 求 来 编写 不 同 的 Mapper 和 Reducer 代 
码 , 并 且 可 能 会 需要 多 次 迭代 来 最 终 完 成 任务 ,如 图 11-1 所 示 。 

了 解 了 基本 原理 以 后 , 接 下 来 我 们 通过 一 个 例子 来 演示 MapReduce 的 应 用 。Windows 
系统 的 升级 日 志文 件 一 般 较 大 , 现 假设 要 求 统计 日 志文 件 中 与 不 同日 期 有 关 的 记录 条 数 。 
首先 将 大 文件 切 分 成 多 个 小 文件 ,然后 对 每 个 小 文件 进行 Map 处 理 , 然 后 对 得 到 的 处 理 结 
果 再 进行 Reduce 处 理 , 最 终 得 到 所 需要 的 数据 和 结论 。 

1. 大 文件 切 分 (FileSplit. py) 

import os 


import os.path 
import time 
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图 11-1 MapReduce 流程 


def FileSplit (sourceFile, targetFolder): 


if not os.path.isfile (sourceFile): # 判 断 文件 是 否 存在 


print sourceFile, ' does not exist." 


return 


切 分 Map Reduce 
小 文件 1 结果 1 
小 文件 2 [———- 结果 2 
大 
x =| 小 文件 3 = 结果 3 最 终结 
件 
小 文件 4 [一 一 =| 结果 4 
小 文件 5 结果 5 


大 数据 处 理 


if not os.path.isdir(targetFolder): “# 切 分 结果 是 多 个 小 文件 ,存放 到 指定 文件 夹 中 


os.mkdir (targetFolder) 


tempData = [] 
number = 1000 # 每 个 小 文件 中 的 记录 条 数 
fileNum -1 # 小 文件 序号 


with open(sourceFile, 'r') as srcFile: 
dataLine =srcFile.readline().strip() 
while dataLine: 
for i in range (number) : 

tempData .append (dataLine) 

dataLine =srcFile.readline() 

if not dataLine: 

break 


desFile =os.path.join(targetFolder, sourceFile[0:-4] +str(fileNum) * '.txt') 


with open(desFile, 'a*') as f: 
f£.writelines (tempData) 
tempData = [] 
fileNum = fileNum +1 
if name --' main ': 


# sourceFile —input('Input the source file to split:') 


# targetFolder —input('Input the target folder you want to place the split files:') 


sourceFile = 'test.txt" 


targetFolder = 'test" 
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FileSplit(sourceFile, targetFolder) 
2. Mapper 代码 (Map. py) 


import os 

import re 

import threading 
import time 


def Map (sourceFile): 
if not os.path.exists (sourceFile): 
print sourceFile, ' does not exist." 
return 
pattern —re.compile (r' [0- 9] (1, 2)/ [0- 9] (1,2)/ [0- 9] (4) ") 
result = (]) 
with open (sourceFile, 'r') as srcFile: 
for dataLine in srcFile: 
r -pattern.findall (dataLine) 
ifr: 
t -result.get (r[0], 0) 
tt=1 
result [r[0]] =t 
desFile =sourceFile[0:-4] +'_map.txt" 
with open (desFile, 'a+') as fp: 
for k, v in result.items(): 
fp.write(k + 


*str(v) +'\n') 


if name --' main ': 
desFolder ='test' 
files -os.listdir (desFolder) 


# 如 果 不 使 用 多 线程 ,可 以 直接 这 样 写 
'"'for f in files: 
Map (desFolder +'\\' 4 £)''" 


# 使 用 多 线程 

def Main(i): 
Map (desFolder + '\\' +files[i]) 

fileNumber = len (files) 

for i in range (fileNumber): 
t =threading. Thread (target =Main, args = (i,)) 
t.start () 


3. Reducer 代码 (Reduce. py) 


import os 


def Reduce (sourceFolder, targetFile): 


# 使 用 正则 表达 式 匹配 日 期 


# 结 果 文件 


if not os.path.isdir(sourceFolder) : 


print sourceFolder, ' does not exist." 


return 


result ={} 


# 使 用 列表 推导 式 来 获取 文件 夹 中 的 Mapper 结果 文件 


allFiles = [sourceFoldert '\\'+f for f in os.listdir (sourceFolder) if f.endswith(' map.txt')] 


for f in allFiles: 


with open(f, 'r') as fp: 
for line in fp: 


line -line.strip() 
if not line: 
continue 
position -line.index(':') 
key = line[0:position] 
value -int (line[position +1:]) 


result [key] =result.get (key,0) +value 


with open(targetFile, 'w') as fp: 


for k,v in result.items(): 


fp.write(k t ':' +str (v) +'\n') 


if name --' main ': 


Reduce ('test', 'test\\result.txt') 


保存 并 运行 上 述 程序 ,首先 运行 FileSplit. py, 将 文件 切 分 ,生成 若干 小 文件 ,如 图 11-2 


所 示 。 


帮助 中 


eR m- 


文件 四) 


LI 


Qs. O- s 


FEV wma IAT 


她 址 加 ) | 加 C: \Python27\ny\MapReduce\test 

[A (E) testi txt E vsu. txt E testats. txt 
文件 和 文件 去 任务 JA O e txt 国 testz3 txt — (testet 
test. txt E) test24. txt test45 txt 
ET 
@ BETAINE B teres. txt 国 test28 tet E) testa. txt 
testé. txt test?T, tet test48 txt 
gg sees Eo Bee Duwa 
(E) tests. txt 目 test29. txt © tests. txt 
E testo txt test. tet — 目 testsl txt 
ME tostio. txt © test31. txt © testsz. txt 
Bennet 目 testaz wet。 目 testss txt 
()tesuzt — (teeGhet — (tenet 
目 testi3. txt 目 test34. txt © testss. txt 
E testit tee E test3S.tet (testet 
© testis. txt © test36. txt © tests7. txt 

Bust — 目 testar txt 

© test17. txt © testa. txt 

©) testis. txt 目 testse, txt 

E testid. tet — (E testo. tat 

| 目 testzo txt 目 test4l.tzxt 

E testi. txt Beste 

z 


图 11-2 文件 切 分 结果 


然后 运行 Map. py 程序 ,得 到 中 间 结 果 , 如 图 11-3 所 示 。 
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xO REO SEV KRW TAD 


#50 
Qm-O B| Par om | 加 


HAIE) (C) C: \PythonZ7\my\WapReduce\test 


Apra Gm 


fee Gers Etayo Gy tert map. tat) tert map. txt 
Etsisa  Etesttt ext E) testOmep. txt Gtest20 map. trt 目 testso map. txt 
E test tet — testes txt test9 me tet test0 map. txt 目 testslnep txt 
目 testes txt testes. txt 目 tesuo map. tzt (E) test3l map txt [E] test52 map. txt 
Bitesize. txt tester ext (e) testi map. txt G) test32 ae txt [E] testss nep tet 


Bennet tested. txt (e testiz map. txt (E) testss 
E tenza txt testes txt (rentis txt (E tert 
四 testzs txt E testS0. txt E) testi txt [E test35 ww txt 目 testss we txt 
Best 目 testsl txt 目 tesus we txt (E) test36 map. txt (E) test5T map. txt 


E) testSi nap. txt 
E) testSS nap. txt 


Bener — tests tt。 目 testls ae txt (E) test3T map. txt 
Buren testit 国 tests3 txt (E) testiT wap. txt GB) teste sw txt 
Otesuz exe — ests txt tertsett (E) testiB map. txt (E) testo map 


*eu»er 四 (est txt E testSS ext (testium txt G) tertio. 
feiern 目 teses txt E) test58. ext E tear 
四 testis txt 目 teses txt rests ut B tese 
tsus txt — 目 tesar txt Brett mep. txt B text 
Burner 目 tesua tt G) testz nap ext Bet 
Otus Muat estaa. tet (D testo nep. txt D testis map. txt 
tense testo en E testimap txt (D testis map. tet f) testi map. txt 

| Qe testar txt E testSmap txt (E) tente map. txt E) test T nap. txt 
Besser — tee tenth txt (D test2T_map. tet (E) textes nap. txt 


图 11-3 运行 Map. py 程序 后 的 结果 


最 后 运行 Reduce. py 程序 ,得 到 最 终结 果 , 如 图 11-4 所 示 。 


result.txt - 记事 本 


FE) MBE) 格式 @) 
2/12/2815:5182 


9/89/2813:733 


图 11-4 运行 Reduce. py 程序 后 的 结果 


本 章 知 识 精 要 


(1) Amazon,Google 等 很 多 大 公司 都 推出 了 自己 的 大 数据 框架 和 服务 ,比较 流行 的 有 
MapReduce, Hadoop 和 Spark。 

(2) MapReduce 编程 的 思路 : 首先 对 大 数据 进行 分 割 , 切 分 为 一 定 大 小 的 小 数据 ;然后 
将 分 割 的 数据 交 给 多 个 Mapper 函数 进行 处 理 , Mapper 函数 处 理 后 将 产生 一 组 规模 较 小 的 
数据 ,多 个 规模 较 小 的 数据 再 提交 给 Reducer 函数 进行 处 理 , 得 到 一 个 更 小 规模 的 数据 或 者 
最 终结 果 。 
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1. 简单 介绍 常见 的 大 数据 处 理 框架 。 
2. 运行 本 章 中 代码 并 理解 MapReduce 编程 思路 。 
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$128 Windows 系统 编程 


Python 是 一 门 强大 的 脚本 语言 , 它 可 以 把 其 他 语言 编写 的 程序 黏合 在 一 起 ,可 以 很 容 
易 地 调用 外 部 程序 ,以 及 调用 其 他 语言 编写 的 动态 链接 库 中 的 代码 ,甚至 还 可 以 将 Python 
程序 打包 为 . exe 可 执行 程序 以 便 在 没有 安装 Python 的 Windows 系统 中 和 运行。 在 本 章 中 
通过 大 量 示例 来 介绍 Windows 平台 的 混合 编程 技术 以 及 底层 编程 技术 ,不 过 有 些 内 容 可 能 
需要 读者 对 Windows 平台 有 和 较 深 层 的 了 解 ,您 可 以 查阅 (Windows 内 核 原理 与 实现 》、 
(Windows 核心 编程 《深入 解析 Windows 操作 系统 ) 或 其 他 相关 书籍 。 

在 本 章 中 大 部 分 程序 主要 使 用 到 pywin32、py2exe、ctypes 和 其 他 几 个 扩展 库 。 由 于 篇 
幅 问题 ,主要 通过 一 些 示例 来 演示 Python 进行 Windows 底层 编程 以 及 混合 编程 的 思路 ,并 
没有 深入 展开 介绍 相关 的 理论 知识 ,而 是 假设 读者 已 经 了 解 或 者 可 以 通过 查阅 相关 资料 进 
行 学 习 。 


12.1 注册 表 编 程 


对 于 Windows 操作 系统 ,注册 表 无 疑 是 非常 重要 的 组 成 部 分 , Windows 将 几乎 所 有 

软 、 硬 件 系 统 配 置信 息 都 保存 在 注册 表 中 。 通 过 读 取 注 册 表 中 的 数据 ,可 以 获取 Windows 
台 的 相应 信息 ,比如 ,已 安装 的 服务 和 程序 列表 、 开 机 自动 运行 的 程序 列表 、 文 件 类 型 与 程 

序 的 关联 关系 等 ;通过 修改 注册 表 中 的 数据 ,可 以 对 Windows 系统 进行 详细 的 配置 。 

Windows 注册 表 有 如 下 5 个 根 键 。 

(D HKEY LOCAL MACHINE (HKLM). 

(2) HKEY CURRENT CONFIG (HKCC ) 。 

(3) HKEY CLASSES ROOT (HKCR). 

(4) HKEY USERS (HKU). 

(5) HKEY CURRENT USER (HKCU), 

单 击 * 开 始 ” 盖 运行 ”命令 ,弹出 “运行 ?对 话 框 ,在 对 话 框 中 输 regedit. exe JF TZ Enter 
键 , 可 以 打开 * 注 册 表 编辑 器 ”窗口 ,如 图 12-1 所 示 ,在 注册 表 编 辑 器 界面 中 可 以 对 注册 表 的 
键 和 值 进行 增 \、 删 . 改 、 查 等 操作 。 

在 注册 表 中 , 值 可 以 为 数值 .字符 串 等 多 种 类 型 ,详细 类 型 如 表 12-1 所 示 。 


表 12-1 注册 表 中 值 的 类 型 


类 型 名 说 明 
REG_NONE 没有 类 型 
REG_SZ 字符 串 类 型 
REG EXPAND SZ 一 个 可 扩展 的 字符 串 值 ,其 中 可 以 包含 环境 变量 
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续 表 


说 H 


REG BINARY 


二 进 制 类 型 


REG_DWORD / REG DWORD LITTLE ENDIAN 


DWORD 类 型 ,用 于 存储 32 位 无 符号 整数 , 即 
0 一 4 294 967 295 之 间 的 整数 ,以 little-endian 
格式 存储 


REG DWORD BIG ENDIAN 


DWORD 类 型 ,用 于 存储 32 位 无 符号 整数 , 即 
0 一 4 294 967 295 之 间 的 整数 ,以 big-endian 格 
式 存储 


REG_LINK 


到 其 他 注册 表 键 的 链接 ,指定 根 键 或 到 目标 键 
的 路 径 


REG, MULTI SZ 


一 个 多 字符 串 值 ,指定 一 个 非 空 字符 串 的 排序 
列表 


REG_RESOURCE_LIST 


资源 列表 ,用 于 枚 举 即 插 即 用 硬件 及 其 配置 


REG FULL RESOURCE DESCRIPTOR 


资源 标识 符 , 用 于 枚 举 即 插 即 用 硬件 及 其 配置 


REG_RESOURCE_REQUIREMENTS_LIST 


资源 需求 列表 ,用 于 枚 举 即 插 即 用 硬件 及 其 配置 


REG_QWORD / REG QWORD LITTLE ENDIAN 


HE) HE) SEW VAXQ) BW 


QWORD 类 型 ,用 于 存储 64 位 无 符号 整数 ,以 
little-endian 格式 存储 或 未 指定 存储 格式 


3 Identities 
GÀ] Keyboard Layout 
& C Microsoft 
@ CJ Printers 
i C) RICOH Aficio MP 1810LD 
QJ SessionInformation 
B&G Software 
@ C3 srst 
C3 UNICODE Program Groups 
C Volatile Environment 
C9 HKEY LOCAL MACHINE 
C3 IEY_VSERS 
d) @ KKEY CURRENT CONFIG 


我 的 电脑 IEY_CURREINT_USER 


日 局 我 的 电脑 名 称 | 类 型 
3 HEY _CLASSES_ROOT Bau REG SZ 
Sy xxt. CURRENT USER 项 necemtLeid REG_DWORD 
H ia Software Mi crosoft\VisualStudio\9.... REG SZ 
@ csm 
Q3 Console 
‘GQ Control Panel 
G@ Environment 
a- rc 
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注册 表 编 辑 器 


对 于 注册 表 编 程 ,可 以 使 用 win32api 模块 和 win32con 模块 ,其 中 win32api 模块 封装 了 
Windows API 函数 ,提供 了 非常 友好 的 接口 。 该 模块 中 常用 的 注册 表 操 作 函 数 有 8 个 。 
(1) RegOpenKey()/RegOpenKeyEx(): 打开 注册 表 。 


(2) RegCloseKey(): 关闭 注册 表 。 


(3) RegQueryValue()/RegQueryValueEx(): 读 取 项 值 。 
(4) RegSetValue()/RegSetValueEx(): 设置 项 值 。 
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(5) RegCreateKeyO /RegCreateKeyExO : 添加 项 。 

(6) RegDeleteKey O : 删除 项 。 

(7) RegEnumKeyO ; 枚 举 子 键 。 

(8) RegDeletetValue(): 删除 值 。 

例如 ,下 面 的 代码 用 来 查询 注册 表 并 输出 本 机 安装 的 IE 浏览 器 软件 版 本 信息 : 


>>> import win32api 
>>> import win32con 

>>> key- win32api. RegOpenKey (win32con. HKEY LOCAL MACHINE, ' SOFTWARE V \ Microsoft \ \ Internet 
Explorer',0,win32con.KEY ALL ACCESS) 

>>> win32api.RegQueryValue (key, ' ') 

" 

»»»win32api.RegQueryValueFx (key, 'Version') 

('8.0.6001.18702', 1) 

>>> win32api .ReqQueryInfoKey (key) 

(64, 12, 130578396029843750L) 

>>> win32api .RegCloseKey (key) 


下 面 的 代码 用 来 检查 随 系 统 启动 而 启动 的 程序 列表 : 


from win32api import * 


from win32con import * 


def GetValues (fullname): 
name- str.split (fullname, 'NV',1) 
try: 
if name[0]-- 'HKEY LOCAL MACHINE': 
key-RegOpenKey (HKEY LOCAL MACHINE,name[1],0,KEY READ) 
elif name[0]-- 'HKEY CURRENT USER': 
key-RegOpenKey (HKEY CURRENT USER,name[1],0,KEY READ) 
elif name[0]-- 'HKEY CURRENT ROOT': 
key-RegOpenKey (HKEY CURRENT ROOT,name[1],0,KEY READ) 
elif name[0]== 'HKEY CURRENT CONFIG': 
key-RegOpenKey (HKEY CURRENT CONFIG,name[1],0,KEY READ) 
elif name[0]-- 'HKEY USERS': 
key= RegOpenKey (HKEY USERS,name[1],0,KEY READ) 
else: 
print 'Error, no key named ',name[0] 
info —RegQueryInfoKey (key) 
for i in range (0,info[1]): 
ValueName = RegEnumValue (key, i) 
print str.ljust (ValueName [0] , 20) , ValueName [1] 
RegCloseKey (key) 
except BaseException,e: 
print 'Sth is wrong' 


print e 
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if name --' main 
KeyNames- ['HKEY LOCAL MACHINE\\SOFTWARE\ \Microsoft \ \Windows \\ 
CurrentVersion\\Run', 
'"HKEY LOCAL MACHINE\\SOFTWARE\ \Microsoft\\Windows\\ 
CurrentVersionWRunOnce', 
HKEY LOCAL MACHINE\\SOFTWARE\\Microsoft\ \Windows\\ 
CurrentVersion\\RunOnceEx", 
‘HKEY_CURRENT_USER\\Software\\Microsoft\\Windows\\ 
CurrentVersion\\Run', 
‘HKEY_CURRENT_USER\\Software\\Microsoft \\Windows\\ 
CurrentVersion\\RunOnce" ] 
for KeyName in KeyNames: 
print KeyName 
GetValues (KeyName) 


操作 Windows 注册 表 的 另外 一 种 常用 方式 是 使 用 Python 模块 _winreg, 该 模块 提供 了 


OpenKey() , DeleteKey ( ) , DeleteValue ( ) , CreateKey ( ) 、SetValue()、QueryValueEx()、 
EnumValueO fll EnumKey() 等 大 量 用 于 注册 表 访 问 和 操作 的 方法 。 下 面 的 代码 演示 了 使 
用 模块 _ winreg 枚 举 注 册 表 值 的 用 法 : 


import winreg 
key =  winreg. OpenKey ( winreg. HKEY CURRENT USER, r" Software V Microsoft \ Windows V 
CurrentVersion\Explorer") 
try: 
i-0 
while 1: 
Name, Value, Type — winreg.EnumValue (key, i) 
print repr (Name), ':',repr(Value), ':', Type 
it-1 
except WindowsError: 
pass 
print '='* 20 
Name ="FaultTime" 
Value, Type — winreg.QueryValueEx (key, Name) 


print Name,Value 


12.2 创建 可 执行 文件 


将 Python 程序 转换 为 . exe 版 本 可 执行 程序 之 后 再 发 布 , 可 以 在 没有 安装 Python 环境 


的 Windows 平台 上 运行 ,这 个 功能 极 大 地 方便 了 用 户 。 为 了 将 Python 程序 转换 为 . exe 可 
执行 文件 ,需要 用 到 py2exe 和 distutils 模块 。 当 然 ,首先 应 保证 您 编写 的 Python 程序 可 以 
正常 运行 ,并 且 本 机 已 安装 了 所 有 需要 的 扩展 模块 和 相关 的 动态 链接 库 文件 。 


例如 ,将 12. 1 节 最 后 的 代码 保存 为 文件 CheckAndViewAutoRunsInSystem. py, 然 后 


编写 setup. py 文件 ,内 容 为 
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import distutils 

import py2exe 

distutils.core.setup(console- ['CheckAndViewAutcRunsInSystem.py']) 

最 后 在 命令 提示 符 下 执行 如 下 命令 : 

python setup.py py2exe 

接 下 来 就 会 看 到 控制 台 窗 口中 大 量 的 提示 内 容 飞 快 地 闪 过 ,这 个 过 程 将 自动 搜集 
CheckAndViewAutoRunsInSystem. py 程序 执行 所 需要 的 所 有 支持 文件 ,如 果 创 建成 功 的 
话 则 会 在 当前 文件 夹 下 生成 一 个 dist 子 文件 夹 ,其 中 包含 了 最 终 程序 执行 所 需要 的 所 有 内 
容 。 等 待 编 译 完成 以 后 ,将 dist 文件 中 的 文件 打包 发 布 即 可 。 例 如 ,上 面 步 又 完成 之 后 ， 
dist 文件 夹 中 的 文件 列表 如 图 12-2 所 示 。 


) BRA TAD 


d$ Pee (> xx - 


Hik QD |p C: \Python27\di st 


文件 和 文件 来 任务 A) ane 
281 KB 
oO ameter 


O 将 这 个 文件 来 发 布 到 um library, zip 
Web CheckhndVi evAuto. WinRAR ZIP 压缩 文件 
kJ FESPA 1,681 KB 


E PIS. idis ^ pywintypes27, dll 
Python Core 2 1.21.0 
Ñ select pyd Ñ unicodedata pyd 
S nm ED EET 
12 Kb 672 KB 
N vinszapi pyd 
waxpopen. exe Pn wi 
96 b 


12-2 dist 文 件 夹 中 的 文件 列表 


py2exe 模块 的 详细 用 法 可 以 查阅 有 关 资 料 ,但 是 对 于 一 般 应 用 而 言 ,上 面 的 代码 已 经 
足够 了 。 唯 一 要 注意 的 问题 是 ,对 于 控制 台 应 用 程序 ,要 想 转 换 为 . exe 可 执行 程序 直接 套 
用 上 面 的 代码 框架 即 可 , 仅 需 要 把 

distutils.core.setup (console- ['CheckAndViewAutoRunsInSystem.py']) 

这 行 代码 中 的 文件 名 替换 为 自己 的 Python 程序 文件 名 即 可 。 对 于 GUI 应 用 程序 , 则 应 该 
将 上 面 代码 中 的 关键 字 console 修改 为 windows。 


12.3 调用 外 部 程序 


在 Python 中 可 以 通过 多 种 不 同 的 方法 来 调用 其 他 语言 编写 的 外 部 程序 或 系统 内 置 命 
令 以 及 动态 链接 库 中 的 代码 ,下 面 简单 介绍 其 中 的 4 种 。 
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个 缺点 ,不 论 启动 什么 程序 会 先 启 动 一 个 黑色 控制 台 窗口 ,然后 再 打开 被 调 程序 


1. 使 用 os 模块 的 方法 调用 外 部 程序 


>>> import os 
»»»0s.system('notepad.exe') 

0 

»»»0s.system('notepad C: WM dir.txt') 
0 


使 用 上 面 的 system() 方 法 也 可 以 调用 Windows 系统 命令 ,如 dir, xcopy 等 ,但 是 有 
,如 图 12-3 


所 示 。 


图 12-3 使 用 os 模块 的 system() 方 法 启动 记事 本 


也 可 以 使 用 os 模块 的 popen() 方 法 来 打开 外 部 程序 ,这 样 不 会 出 现 黑色 的 命令 提示 符 


窗口 。 


>>>os.popen (r'C:\windows\notepad.exe') 


<open file 'C:\\windows\\notepad.exe', mode 'r' at 0x012BEF98> 


或 者 ,还 可 以 使 用 os 模块 的 startfile() 方 法 来 打开 外 部 程序 或 文件 ,系统 将 自动 关联 相应 的 
程序 来 打开 或 执行 文件 


>>> import os 
>>> os.startfile (r'C:\windows\notepad.exe') 


>>> os.startfile(r'wxIsPrime.py') 
2. 使 用 win32api 模块 调用 ShellExecute() 函数 来 启动 外 部 程序 


>>> import win32api 
»»»win32api.ShellExecute(0, 'open', 'notepad.exe', '', '',0) #0 表 示 后 台 运 行程 序 
42 


>>>win32api.ShellExecute(0, 'open', 'notepad.exe', '', '',1) #1 表示 前 台 运 行程 序 
42 
»»»win32api.ShellExecute (0, 'open' , 'notepad.exe', 'C:\\dir.txt', '',1) 

# 传 递 参数 打开 指定 文件 
42 
>>>win32api.ShellExecute (0, 'open', 'www.python.org',','',1) # 打 开 网 址 
42 
»»»win32api.ShellExecute(0, 'open',r'C:Mdir.txt', '', '',1) # 相 当 于 双击 文件 
42 


使 用 这 种 方式 运行 程序 或 者 打开 文件 时 ,不 会 像 os 模块 的 system ) 方 法 那样 先 打开 
一 个 命令 提示 符 窗口 ,并且 系统 将 根据 文件 类 型 自动 关联 相应 程序 并 打开 文件 ,类 似 于 在 资 
源 管 理 器 中 双击 打开 文件 或 单 击 打开 超 链接 。 例 如 ,如 果 打 开 的 是 记事 本 文件 , 则 会 自动 使 
用 记事 本 程序 打开 ;如 果 指 定 的 是 个 域名 , 则 会 自动 使 用 默认 浏览 器 打开 该 网 址 ;如 果 打 开 
的 是 可 执行 文件 , 则 会 自动 打开 并 运行 该 程序 文件 。 

3. 通过 创建 进程 来 启动 外 部 程序 


>>> import win32process 
>> > handle = win32process. CreateProcess (r ' C: V windows V notepad. exe ',", None, None, 0, 
win32process.CREATE NO WINDOW, None, None,win32process.STARTUPINFO|()) 

# 打 开 记事 本 程序 
>>> win32process.TerminateProcess (handle [0] , 0) # 关 闭 刚才 打开 的 程序 
>>> handle = win32process. CreateProcess (r ' C: \ windows \ notepad. exe ', ' ', None, None, 0, 
win32process.CREATE NO WINDOW, None, None, win32process.STARTUPINFO ()) 
>>> import win32event 
>>> win32event .WaitForSingleObject (handle [0], - 1) # 需 要 手动 关闭 记事 本 
0 


4. 通过 etypes 来 调用 动态 链接 库 代 码 

ctypes 是 Python 处 理 动态 链接 库 的 标准 扩展 模块 ,提供 了 与 C 语言 兼容 的 数据 类 型 ， 
允许 在 Python 程序 中 调用 动态 链接 库 或 共享 库 中 的 代码 ,从 而 支持 Python 与 其 他 编程 语 
言 的 混合 编程 ,充分 发 挥 各 自 的 优势 ,大 幅度 提高 开发 效率 和 运行 效率 。 另 外 ,NumPy 模块 
也 提供 了 一 个 函数 numpy. ctypeslib. load_library() 用 来 打开 指定 的 动态 链接 库 并 返回 一 
个 ctypes 对 象 ,通过 该 对 象 可 以 访问 动态 链接 库 中 的 函数 。 或 者 ,使 用 SciPy 库 的 Weave 
模块 也 可 以 方便 地 将 C++ 程序 以 字符 串 的 形式 嵌入 到 Python 程序 中 。 由 于 篇 幅 问 题 , 关 
于 混合 编程 更 多 的 资料 ,读者 可 以 查阅 相关 资料 进行 学 习 , 本 章 重点 介绍 如 何 使 用 ctypes 
扩展 模块 调用 动态 链接 库 中 的 代码 。 

ctypes 提供 了 3 种 方法 调用 动态 链接 库 : cdll windll 和 oledll, 它 们 的 不 同 之 处 在 于 函 
数 调用 时 的 参数 传递 方式 和 返回 时 栈 的 平衡 方式 。cdll 加 载 的 库 导 出 的 函数 必须 使 用 标准 
的 cdecl 调用 约定 (函数 的 参数 从 右 往 左 依次 压 人 栈 内 ,在 函数 执行 完成 后 ,由 函数 的 调用 
者 负责 函数 的 栈 帧 平衡 ), windll 方法 加 载 的 库 导 出 的 函数 必须 使 用 stdcall 调用 约定 
CWin32 API 的 原生 约定 ) ,oledll 方法 和 windll 类 似 , 不 过 假设 函数 返回 一 个 HRESULT 
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错误 代码 。 

下 面 的 代码 调用 Windows 动态 链接 库 user32. dll 中 的 MessageBoxA() 函 数 来 显示 对 
WHE: 

>>> import ctypes # 通 过 ctypes 可 以 调用 动态 链接 库 中 的 函数 


»»»user32- ctypes .windll.LoadLibrary ('user32.dll') 
»»»user32.MessageBoxA (0, str encode ("Hello world!'),str.encode ("Python 
ctypes'),0) 

1 


或 者 使 用 下 面 更 为 简洁 的 形式 : 


>>> import ctypes 
>>> ctypes. windll. user32. MessageBoxA (0, str. encode ("Hello world! '), str. encode (' Python 


ctypes'),0) 
下 面 的 代码 调用 标准 C 函数 库 msvert 中 的 printf O 函数 来 输出 文本 : 


import ctypes 
msvcrt- ctypes.cdll.LoadLibrary ('msvcrt') 
printf-msvcrt.printf 


printf ('Hello world!') 
或 者 使 用 下 面 形式 : 


import ctypes 

ctypes.cdll.msvcrt.printf ('Hello world!') 

该 程序 需要 在 命令 提示 符 环境 中 而 不 是 在 IDLE 中 执行 ,如 果 在 IDLE 环境 中 运行 
输出 的 是 字符 数量 而 不 是 字符 ,例如 ,将 上 面 的 代码 复制 到 IDLE 交互 窗口 执行 结果 
Wr. 


>>> import ctypes 

>>> ctypes.cdll.msvert.printf ("Hello world! ') 

12 

假设 将 上 面 的 代码 保存 为 useprintfthroughctypes. py 文件 ,然后 在 命令 提示 符 中 运行 
结果 如 图 12-4 Bros 。 


useprintfthroughctypes.py 


rintfthroughct ypes -py 


图 12-4 使 用 ctypes 库 调用 C 语言 的 printf 函数 


ctypes 提供 了 与 C 语言 兼容 的 数据 类 型 .但 在 Python 中 使 用 C 语言 的 结构 体 时 ,需要 
用 类 来 改写 。 表 12-2 给 出 了 基本 类 型 的 对 应 关系 ,关于 结构 体 改写 的 内 容 可 以 通过 后 面 给 
出 的 示例 代码 了 解 大 概 思 路 。 
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表 12-2 基本 类 型 对 应 关系 


ctypes type C type Python type 
c_bool _Bool bool (1) 
c_char char l-character string 
c wchar wchar t l-character unicode string 
c byte char int/long 
c ubyte unsigned char int/long 
c short short int/long 
c ushort unsigned short int/long 
c int int int/long 
c uint unsigned int int/long 
c. long long int/long 
c ulong unsigned long int/long 
c longlong . int64 or long long int/long 
c ulonglong unsigned — int64 or unsigned long long int/long 
c float float float 
c double double float 
c longdouble long double float 
c char p char * (NUL terminated) string or None 
c wchar p wchar t * (NUL terminated) unicode or None 
c void p void * int/long or None 


ctypes 是 Python 进行 操作 系统 底层 开发 的 重要 技术 ,借助 于 该 扩展 库 , 可 以 访问 操作 
系统 所 有 底层 功能 ,例如 ,下 面 的 代码 可 以 枚 举 系统 当前 运行 的 进程 列表 : 

# EnumProcess.py 

from ctypes.wintypes import * 

from ctypes import * 

import collections 


kernel32 -windll.kernel32 


class tagPROCESSENTRY32 (Structure): 定义 结构 体 
fields -[('dwSize', DWORD) , 
('entUsage', DWORD) , 
("th32ProcessID', DWORD), 
('th32DefaultHeapID', POINTER (ULONG) ) , 
("th32ModuleID', DWORD), 
('cntThreads', DWORD), 
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("th32ParentProcessID', DWORD), 


("pcPriClassBase', LONG), 
('dwFlags', DWORD), 
("szExeFile', c char * 260)] 


def enumProcess () : 
hSnapshot —kernel32.CreateToolhelp32Snapshot (15, 0) 
fProcessEntry32 = tagPROCESSENTRY32 () 
processClass = collections.namedtuple ("processInfo", "processName processID") 
processSet - [] 
if hSnapshot: 
fProcessEntry32.dwSize = sizeof (fProcessEntry32) 
listloop =kerne132.Process32First (hSnapshot, byref (fProcessEntry32)) 
while listloop: 
processName = (fProcessEntry32.szExeFile) 
processID = fProcessEntry32.th32ProcessID 
processSet .append (processClass (processName, processID)) 
listloop = kernel32.Process32Next (hSnapshot, byref (fProcessEntry32)) 
return processSet 
for i in enumProcess () : 


print (i.processName, i.processID) 


12.4 创建 窗口 


在 本 节 中 ,主要 介绍 在 Python 中 使 用 Windows API 函数 和 MFC 创建 窗口 的 思路 和 
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CD. 可 以 调用 Windows 底层 API 函数 来 创建 窗口 并 构建 消息 循环 ,代码 如 下 : 


import win32gui 
from win32con import 关 
def WndProc (hwnd,msg, wParam, lParam) : 
if msg==WM PAINT: 
hdc,ps =win32gui.BeginPaint (hwnd) 
rect-win32gui .GetClientRect (hwnd) 
win32gui.DrawText (hdc, 'GUI Python',len('GUI Python'),rect, 
DT SINGLELINE|DT CENTER|DT VCENTER) 
win32gui.EndPaint (hwnd, ps) 
if msg ==WM_DESTROY: 
win32gui .PostQuitMessage (0) 


return win32gui.DefWindowProc (hwnd, msg, wParam, lParam) 


wc =win32gui .WNDCLASS () 
wc.hbrBackground =COLOR_BTNFACE +1 
wc.hCursor =win32gui.LoadCursor (0, IDC ARROW) 


Windows 系统 


wc.hIcon —win32gui.LoadIcon(0, IDI APPLICATION) 
wc.lpszClassName = 'Python on Windows" 
wc.lpfnWndProc =WndProc 


reg —win32gui.RegisterClass (wc) 


hwnd =win32gui .CreateWindow( 
reg, 'Python', WS OVERLAPPEDWINDOW, CW USEDEFAULT, CW USEDEFAULT, 
CW USEDEFAULT, CW USEDEFAULT, 0, 0, 0, None) 
win32gui.ShowWindow(hwnd, SW SHOWNORMAL) 
win32gui.UpdateWindow (hwnd) 


win32gui.PumpMessages () 
(2) 使 用 MPC 创建 窗口 ,并 创建 菜单 。 


import win32ui 
import win32api 
from win32con import * 


from pywin.mfc import window 


class MyWnd (window.Wnd) : 
def init (self): 
window.Wnd. init (self, win32ui.CreateWnd()) 
self. obj .CreateWindowEx(WS EX CLIENTEDGE, 
win32ui.RegisterWndClass (0, 0, COLOR WINDOW 1), 
"MEC GUI', WS OVERLAPPEDWINDOW, 
(10,10,800,500), None, 0, None) 


self .HookMessage (self.OnRClick, WM RBUTTONDOWN) 


submenu — win32ui.CreateMenu() 

menu —win32ui.CreateMenu() 

submenu.AppendMenu(MF STRING, 1051, '&Open') 
submenu.AppendMenu(MF STRING, 1052, '&Close') 
submenu.AppendMenu(MF STRING, 1053, '&Save') 

menu.AppendMenu(MF STRING | MF POPUP, submenu.GetHandle(), '&File') 


submenu —win32ui .CreateMenu () 

submenu.AppendMenu(MF STRING, 1054, '&Copy') 
submenu.AppendMenu(MF STRING, 1055, '&Paste') 
submenu.AppendMenu(MF SEPARATOR, 1056, None) 
submenu.AppendMenu(MF STRING, 1057, 'C&ut') 

menu.AppendMenu(MF STRING | MF POPUP, submenu.GetHandle(), '&Edit') 
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submenu =win32ui .CreateMenu () 
submenu.AppendMenu(MF STRING, 1058, "Tools') 
submenu.AppendMenu(MF STRING | MF GRAYED, 1059, 'Settings') 

m =win32ui .CreateMenu () 

m.AppendMenu(MF STRING | MF POPUP | MF CHECKED, submenu.GetHandle(), 'Option') 
menu.AppendMenu(MF STRING | MF POPUP, m.GetHandle(), 'sOther') 


self. obj .SetMenu (menu) 

self.HookCommand (self.MenuClick, 1051) 
self.HookCommand (self.MenuClick, 1052) 
self.HookCommand (self.MenuClick, 1053) 
self.HookCommand (self.MenuClick, 1054) 
self.HookCommand (self .MenuClick, 1060) 


def OnRClick (self,param): 
submenu —win32ui.CreatePopupMenu() 
submenu.AppendMenu(MF STRING, 1060, 'Copy') 
submenu.AppendMenu(MF STRING, 1061, 'Paste') 
submenu.AppendMenu(MF SEPARATOR, 1062, None) 
submenu.AppendMenu(MF STRING, 1063, 'Cut') 
submenu.TrackPopupMenu (param[5], TPM LEFTALIGN | TPM LEFTBUTTON | TPM RIGHTBUTTON, 
self) 


def MenuClick(self, lParam, wParam): 
if lParam ==1051: 
self .MessageBox('Open', 'Python', MB OK) 
elif lParam ==1053: 
self .MessageBox('Save', 'Python', MB OK) 
elif lParam ==1052: 
self.OnClose() 
elif lParam ==1060 or lParam ==1054: 
self .MessageBox('Copy', 'Python', MB OK) 


def OnClose (self): 
self.EndModalLoop (0) 


def OnPaint (self): 
dc, ps = self.BeginPaint () 
dc.DrawText ("MFC GUI', self.GetClientRect (), 
DT SINGLELINE | DT CENTER | DT VCENTER) 
self.EndPaint (ps) 


w —MyWnd () 
w.ShowWindow () 


w.UpdateWindow () 
w.RunModalLoop (1) 


下 面 的 代码 演示 了 创建 MFC 窗口 并 响应 按钮 消息 的 过 程 : 


import win32ui 
import win32con 
from pywin.mfc import dialog 


class MyDialog (dialog.Dialog): 

def OnInitDialog (self): 
dialog.Dialog.OnInitDialog (self) 
self.HookCommand (self.OnButtonl, 1051) 
self .HookCommand (self .OnButton2, 1052) 

def OnButtonl (self, wPrarm, lParam) : 
win32ui.MessageBox('Buttonl', 'Python', win32con.MB OK) 
# self.EndDialog(1) 

def OnButton2 (self, wParam, lParam): 
text —self.GetDlgItemText (1054) 
win32ui.MessageBox(text, 'Python', win32con.MB OK) 
# self.EndDialog(1) 


style -win32con.DS MODALFRAME | win32con.WS POPUP | win32con.WS VISIBLE V 
| win32con.WS CAPTION | win32con.WS SYSMENU | win32con.DS SETFONT 

childstyle —win32con.WS CHILD | win32con.WS VISIBLE 

buttonstyle —win32con.WS TABSTOP | childstyle 


di =['Python', (0,0,300,180), style, None, (8,'MS Sans Serif')] 
Buttonl = (['Button', 'Buttonl', 1051, (80, 150, 50, 14), 
buttonstyle | win32con.BS PUSHBUTTON]) 
Button2 = (['Button', 'Button2', 1052, (160, 150, 50, 14), 
buttonstyle | win32con.BS PUSHBUTTON]) 
Stadic = (['Static', 'Python Dialog', 1053, (130, 50, 60, 14), childstyle]) 
Edit = (['Edit', '', 1054, (130, 80, 60, 14), 
childstyle | win32con.ES LEFT | win32con.WS BORDER | win32con.WS TABSTOP]) 


init =[] 

init .append (di) 

init .append (Button1) 
init .append (Button2) 
init .append (Stadic) 
init .append (Edit) 


mydialog =MyDialog (init) 
mydialog.DoModal () 
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12.5 判断 操作 系统 的 版 本 


某 些 情况 下 ,程序 可 能 依赖 于 特定 版 本 操作 系统 中 的 功能 或 者 希望 程序 在 不 同 版 本 的 


操作 系统 中 有 不 同 的 表现 ,因此 能 够 在 程序 运行 时 获知 操作 系统 的 版 本 就 变 得 非常 有 必要 。 
Python 支持 使 用 多 种 不 同 的 方法 来 获取 操作 系统 的 版 本 信息 。 


下 面 的 代码 演示 了 使 用 不 同 的 方法 来 获取 本 机 Windows 操作 系统 的 版 本 信息 的 用 法 : 


>>> import os 

>>> print (os.popen ("ver") .read()) 

Microsoft Windows [版 本 6.1.7601] 

»»»import sys 

>>> print (sys.getwindowsversion|()) 

sys.getwindowsversion (major= 6, minor=1, build- 7601, platform- 2, service pack- 'Service 
Pack 1') 

>>> import platform 

>>> print (platform.platform() ) 

Windows- 7- 6.1.7601- SP1 


Windows 管理 规范 (Windows Management Instrumentation, WMI) # Windows 的 一 


项 核心 技术 , 它 以 公共 信息 模型 对 象 管理 器 (Common Information Model Object Manager, 
CIMOMD) 为 基础 ,是 一 个 描述 Windows 操作 系统 构成 单元 的 对 象 数据 库 。WMI 是 
Windows 的 核心 组 件 ,通过 编写 W MT 脚本 和 应 用 程序 可 以 获取 计算 机 系统 、 软 件 和 硬件 信 
息 , 还 可 以 对 计算 机 进行 管理 ,比如 关机 、 重 新 启动 计算 机 等 。 


>>> import wmi 

>>> wmiShell =wmi .WMI () 

>>>print (wniShell.Win32 OperatingSystem() [0] .Caption) 
Microsoft Windows 7 旗舰 版 


还 可 以 通过 os. system(ver) 语 句 来 查看 Windows 操作 系统 的 版 本 ,但 需要 编写 程序 


并 在 命令 提示 符 环境 中 运行 ,在 IDLE 环境 中 运行 无 法 查看 结果 。 


本 章 知识 精 要 


(1) pywin32 封装 了 Windows 底层 的 几乎 所 有 API 函数 。 

(2) 使 用 ctypes 模块 可 以 调用 任意 其 他 语言 编写 的 动态 链接 库 或 共享 库 文件 。 

(3) 使 用 py2exe 可 以 方便 地 将 Python 程序 转换 为 . exe 程序 。 

(4) 可 以 通过 os 模块 的 system() ,popen() 和 startfile() 等 方法 方便 地 调用 外 部 程序 或 


打开 磁盘 上 的 文件 ,也 可 以 使 用 win32api 模块 的 ShellExecute() 方 法 或 win32process 模块 
的 CreateProcess() 方 法 实现 这 一 目的 。 


(5) ctypes 提供 了 3 种 调用 动态 链接 库 文件 的 方法 ,分 别 为 cdll windll 和 oledll ,它们 


的 不 同 之 处 在 于 调用 函数 时 的 参数 传递 方式 和 函数 返回 时 的 栈 平衡 方式 。 
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(6) 在 Windows 平 台 上 ,可 以 通过 sys 模块 的 getwindowsversion O , platform 模块 的 
platform() 以 及 wmi 模块 等 多 种 方法 来 动态 检测 系统 版 本 。 


习 题 


. 查阅 相关 资料 ,解释 注册 表 几 大 根 键 的 用 途 。 

. 选择 一 个 编写 好 的 Python 程序 ,将 其 转换 为 . exe 可 执行 文件 。 
.编写 代码 ,使 用 至 少 3 种 不 同 的 方法 启动 Windows 自 带 的 计算 器 程序 。 
.编写 代码 ,检测 您 所 使 用 的 操作 系统 版 本 。 


a wuye 
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第 13 章 多 线程 编程 


由 于 硬件 技术 的 飞速 发 展 ,早期 的 多 核 , 多 处 理 器 等 高 端 技 术 已 经 走 进 了 普通 家 庭 ,再 
加 上 内 存 、 主 频 、 硬 盘 等 各 种 硬件 配置 的 飞速 提高 ,大 幅度 提高 了 普通 PC 的 运算 速度 和 数 
据 处 理 能 力 。 在 多 核 ` 多 处 理 器 平台 上 ,每 个 核 可 以 运行 一 个 线程 ,多 个 线程 同时 和 运行 并 相 
互 协作 ,从 而 达到 高 速 处 理 任务 的 目的 。 

然而 ,即使 是 高 端 服务 器 或 工作 站 甚至 集群 系统 ,处 理 器 和 核 的 数量 总 是 有 限 的 ,如 果 
线程 的 数量 多 于 核 的 数量 ,就 必然 需要 进行 调度 。 在 调度 时 ,处 理 器 为 每 个 线程 分 配 一 个 很 
短 的 时 间 片 ,所 有 线程 根据 具体 的 调度 算法 轮流 获得 该 时 间 片 。 当 时 间 片 用 完 以 后 ,即使 该 
线程 还 没有 执行 完 也 要 退出 处 理 器 并 等 待 下 次 调度 。 由 于 处 理 器 中 寄存 器 的 数量 有 限 ,而 
不 同 的 线程 很 可 能 需要 使 用 到 相同 的 一 组 寄存 器 来 保存 中 间 计 算 结 果 或 当前 状态 。 因 此 ， 
在 调度 线程 时 必须 要 做 好 上 下 文保 存 和 恢复 工作 ,以 保证 该 线程 下 次 被 调度 进 处理 器 后 能 
够 继续 上 次 的 工作 。 虽 然 这些 工 作 并 不 需要 Python 程序 员 操 心 , 但 是 我 们 必须 清楚 的 一 
件 事 是 ,并 不 是 使 用 的 线程 数量 越 多 越 好 ,如 果 线 程 太 多 的 话 ,线程 调 度 带 来 的 开销 可 能 会 
比 线程 实际 执行 的 开销 还 大 ,这 样 使 用 多 线程 就 失去 本 来 的 意义 了 。 


13.1 threading 模块 


threading 模块 是 Python 支持 多 线程 编程 的 重要 模块 ,该 模块 是 在 底层 模块 _thread 的 
基础 上 开发 的 更 高 层次 的 线程 编程 接口 ,提供 了 大 量 的 方法 和 类 来 支持 多 线程 编程 , 极 大 地 
方便 了 用 户 。threading 模块 常用 方法 如 表 13-1 所 示 。 


表 13-1 threading 模块 常用 方法 


方 法 功能 说 明 


threading. active_count() 返回 当前 处 于 alive 状态 的 Thread 对 象 数量 


threading. current_thread() | 返回 当前 Thread 对 象 
返回 当前 线程 的 线程 标识 符 。 线 程 标识 符 是 一 个 非 负 整数 ,并 没 特 殊 含 


threading. get_ident() 义 , 只 是 用 来 标识 线程 ,该 整数 可 能 会 被 循环 利用 。Python 3. 3 及 以 后 版 
本 支持 该 方法 

threading. enumerate() 返回 当前 处 于 alive 状态 的 所 有 Thread 对 象 列 表 
返回 主线 程 对 象 , 即 启动 Python 解释 器 的 线程 对 象 。Python 3. 4 及 以 后 


threading. main_thread() 


版 本 支持 该 方法 

返回 创建 线程 时 使 用 的 栈 的 大 小 ,如 果 指 定 size 参数 , 则 用 来 指定 后 续 创 
threading. stack_size([size]) | 建 的 线程 使 用 的 栈 大 小 ,size 必须 是 0( 表 示 使 用 系统 默认 值 ) 或 大 于 32K 
的 正 整数 


多 线程 编程 


下 面 的 代码 简单 演示 了 该 模块 方法 的 用 法 : 


>>> import threading 
»»»threading.stack size() # 查 看 当前 线程 栈 的 大 小 
0 
»»»threading.stack size(64x 1024) # 设 置 当 前 线程 栈 的 大 小 
0 
»»»threading.stack size() 
65536 
»»»threading.active count () 
2 
»»»threading.current thread() 
« MainThread(MainThread, started 4852)» 
>>> threading.enumerate () 
[< Thread (SockThread, started daemon 9620)» , <_MainThread(MainThread, started 4852)>] 


13.2 Thread 对 象 


threading 模块 提供 了 Thread, Lock, RLock , Condition, Event, Timer 和 Semaphore 等 
大 量 类 来 支持 多 线程 编程 ,Thread 是 其 中 最 重要 也 是 最 基本 的 一 个 类 ,可 以 通过 该 类 创建 
线程 并 控制 线程 的 运行 。 本 节 首 先 介绍 Thread 对 象 ,然后 在 13.3 节 介 绍 线程 同步 技术 以 
及 Lock,RLock,Condition 和 Event 等 对 象 的 用 法 。 

Thread 类 支持 使 用 两 种 方法 来 创建 线程 : 一 种 方法 是 为 构造 函数 传递 一 个 可 调用 对 
象 ; 另 一 种 方法 是 继承 Thread 类 并 在 派生 类 中 重 写 _init_() 和 runO) 方 法 。 创 建 线程 对 象 
以 后 ,可 以 调用 其 start() 方 法 来 启动 ,该 方法 自动 调用 该 类 对 象 的 run() 方 法 ,此 时 该 线程 
处 于 alive 状态 ,直至 线程 的 run() 方 法 运行 结束 。Thread 对 象 成 员 如 表 13-2 所 示 。 

表 13-2 Thread 对 象 成 员 


成 A 说 明 
start() 自动 调用 run() 方 法 ,启动 线程 ,执行 线程 代码 
线程 代码 ,用 来 实现 线程 的 功能 与 业务 逻辑 ,可 
以 在 子 类 中 重 写 该 方法 来 自 定义 线程 的 行为 


_init_ (self, group — None, target — None. name = 


None, args— O , kwargs— None, verbose— None) KEER 

name 用 来 读 取 或 设置 线程 的 名 字 

ident 线程 标识 , 非 0 数字 或 None( 线 程 未 被 启动 ) 
is aliveO visAliveO 测试 线程 是 否 处 于 alive 状态 

daemon 布尔 值 ,表示 线程 是 否 为 守护 线程 
joinCtimeout None) 等 待 线程 结束 或 超时 返回 


13.2.1 Thread 对象 中 的 方法 
(1) join([ timeout D ; 阻塞 当前 线程 ,等 待 被 调 线程 结束 或 超时 后 再 继续 执行 当前 线程 
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的 后 续 代 码 ,参数 timeout 用 来 指定 最 长 等 待 时 间 ,单位 为 秒 。 


import threading 
import time 
def funcl(x, y): 
fori in range(x, y): 
print i, 


time.sleep(10) 


tl-threading.Thread (target =funcl, args = (15, 20)) 
tl.start() 

t1.join(5) 

t2- threading.Thread (target =funcl, args = (5, 10)) 
t2.start() 


保存 并 运行 上 面 的 程序 将 会 发 现 , 首 先 输出 15 一 19 这 5 个 整数 ,然后 程序 暂停 , 几 秒 钟 


以 后 又 继续 输出 5 一 9 这 5 个 整数 。 如 果 将 t1. join(5) 这 一 行 注释 掉 再 运行 ,两 个 线程 的 输 


出 将 会 重重 在 一 起 ,这 是 因为 两 个 线程 并 发 运行 ,而 不 是 第 一 个 结束 以 后 再 运行 第 二 个 。 可 
以 说 ,这 是 线程 同步 的 一 个 最 简单 的 形式 。 当 然 ,还 可 以 把 time. sleep(10) 这 一 行 注释 掉 再 
运行 ,会 发 现 两 个 线程 的 输出 之 间 没 有 时 间 间 隔 ,您 能 想 明 白 其 中 的 原因 吗 ? 


(2) isAliveO ; 测试 线程 是 否 处 于 运行 状态 。 


import threading 
import time 
def funcl(x, y): 
fori in range(x, y): 
print i 


$time.sleep (10) 


tl-threading.Thread (target = funcl, args = (15, 20)) 


tl.start() 

tl.join(5) # 注 释 掉 这 里 试 试 

t2= threading.Thread (target = funcl, args = (5, 10)) 
t2.start () 

t2.join() # 注 释 掉 这 里 试 试 


print 'tl:',tl.isAlive() 


print 't2:',t2.isAlive() 


运行 上 面 的 程序 会 发 现 ,最 后 两 个 的 输出 都 是 False, 即 两 个 线程 都 执行 完了 。 如 果 将 


tl.join(5) 这 一 行 注释 掉 会 发 现 最 后 两 行 的 输出 结果 没有 变化 ,这 是 因为 t2. join() 这 一 行 
代码 会 阻塞 当前 程序 直至 线程 t2 运行 结束 ,对 于 本 例 中 的 线程 tl 基本 也 运行 结束 了 。 如 
果 将 线程 tl 的 参数 范围 增 大 则 会 发 现 , 倒 数 第 二 行 的 输出 结果 很 可 能 会 变 为 True。 请 您 
再 单独 将 (2. join() 这 一 行 注释 掉 而 保留 tl. join(5) 再 运行 程序 ,尝试 着 理解 运行 结果 , 当 
然 ,为 了 验证 您 的 答案 ,可 以 将 线程 的 参数 范围 适当 变 大 和 变 小 。 
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13.2.2 Thread 对象 中 的 daemon 属性 
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在 脚本 运行 过 程 中 有 一 个 主线 程 , 若 在 主线 程 中 创建 了 子 线程 ,当主 线程 结束 时 根据 子 
线程 daemon 属性 值 的 不 同 可 能 会 发 生 下 面 的 两 种 情况 之 一 : 四 当 某 子 线程 的 daemon 属 
性 为 False 时 ,主线 程 结 束 时 会 检测 该 子 线程 是 否 结束 ,如 果 该 子 线程 尚未 完成 , 则 主线 程 
会 等 待 它 完成 后 再 退出 ; @ 当 某 子 线程 的 daemon 属性 为 True 时 ,主线 程 运行 结束 时 不 对 
该 子 线程 进行 检查 而 直接 退出 ,同时 所 有 daemon 值 为 True 的 子 线程 将 随 主线 程 一 起 结 
束 , 而 不 论 是 否 运行 完成 。daemon 属性 的 值 默 认为 False, 如果 需要 修改 , 则 必须 在 调用 


start() 方 法 启动 线程 之 前 进行 修改 。 


以 上 论述 不 适用 于 IDLE 环境 中 的 交互 模式 或 脚本 运行 模式 ,因为 在 该 环境 中 的 主线 


程 只 有 在 退出 Python IDLE 时 才 终止 。 
import threading 


import time 


class mythread (threading.Thread): 
def init (self, num, threadname): 


threading.Thread. init__(self, name =threadname) 


self.num - num 

# self.daemon - True 
def run(self): 

time.sleep (self.num) 


print self.num 


tl =mythread(1, 'tl') 
t2 =mythread(5, 't2') 
t2.daemon - True 
print tl.daemon 


print t2.daemon 


tl.start() 
t2.start() 


将 上 面 的 代码 存储 为 ThreadDaemon. py 文件 ,在 IDLE 环境 中 运行 结果 如 图 13-1 所 


AB ,在 命令 提示 符 环境 中 运行 结果 如 图 13-2 所 示 。 


图 13-1 ThreadDaemon. py 程序 在 IDLE 环境 中 的 运行 结果 
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"eia 


图 13-2 ThreadDaemon. py 


程序 在 命令 提示 符 环境 中 的 运行 结果 


13.3 线程 同步 技术 


毫 无 疑问 ,多 线程 是 为 了 充分 利用 硬件 资源 尤其 是 CPU 资源 来 提高 任务 处 理 速度 和 
效率 的 技术 。 将 任务 拆 分 成 互相 协作 的 多 个 线程 同时 运行 ,那么 属于 同一 个 任务 的 多 个 线 
程 之 间 必 然 会 有 交互 和 同步 以 便 互相 协作 地 完成 任务 。 另 外 ,还 可 以 使 用 多 线程 来 为 用 户 
提供 很 多 的 方便 。 例 如 ,打开 软件 时 可 能 需要 加 载 大 量 的 模块 和 库 , 这 可 能 需要 较 长 的 时 
间 , 此 时 可 以 使 用 一 个 线程 来 显示 一 个 小 动画 来 表示 当前 软件 正在 启动 ,而 当 后 台 线 程 加 载 
完 所 有 的 模块 和 库 之 后 ,结束 该 动画 的 播放 并 打开 软件 主 界面 ,这 是 多 线程 同步 的 一 个 典型 
应 用 。 再 例如 , 字 处 理 软 件 可 以 使 用 一 个 线程 来 接受 用 户 键 盘 输 入 ,而 使 用 一 个 后 台 线 程 来 
进行 拼写 检查 以 及 字数 统计 之 类 的 功能 并 实时 将 结果 显示 在 状态 栏 上 ,这 无 疑 会 极 大 方便 
用 户 的 使 用 ,对 于 提高 用 户 体验 有 重要 帮助 。 类 似 的 多 线程 应 用 案例 还 有 很 多 ,您 是 不 是 还 
能 再 想起 来 几 个 呢 ? 

Python 的 threading 模块 提供 了 多 种 用 于 线程 同步 的 对 象 , 在 本 节 中 将 一 一 进行 介绍 。 


13.3.1 Lock/RLock 对 象 


Lock 是 比较 低级 的 同步 原 语 , 当 被 锁定 以 后 不 属于 特定 的 线程 。 一 个 锁 有 两 种 状态 : 
locked 和 unlocked。 如 果 锁 处 于 unlocked 状态 ,acquire() 方 法 将 其 修改 为 locked 并 立即 返 
回 ;如 果 锁 已 处 于 locked 状态 , 则 阻塞 当前 线程 并 等 待 其 他 线程 释放 锁 , 然后 将 其 修改 为 
locked 并 立即 返回 。release() 方 法 用 来 将 锁 的 状态 由 locked 修改 为 unlocked 并 立即 返回 ， 
如 果 锁 状态 本 来 已 经 是 unlocked, 调 用 该 方法 将 会 抛 出 异常 。 

可 重 入 锁 RLock 对 象 也 是 一 种 常用 的 线程 同步 原 语 ,可 被 同一 个 线程 acquire() 多 次 。 
当 处 于 locked 状态 时 , 某 线程 拥有 该 锁 ; 当 处 于 unlocked 状态 时 ,该 锁 不 属于 任何 线程 。 
RLock 对 象 的 acquire()/release() 调 用 对 可 以 租 套 , 仅 当 最 后 一 个 或 者 最 外 层 的 release() 
执行 结束 后 , 锁 才 会 被 设置 为 unlocked 状态 。 

下 面 的 代码 演示 了 使 用 Lock/RLock 对 象 实现 线程 同步 的 思路 和 步骤 : 


import threading 
import time 
class mythread (threading.Thread) : 
def init (self): 
threading.Thread. init (self) 
def run (self) : 
global x 


lock.acquire() 


多 线程 编程 


for i in range(3): 
x-xti 
time.sleep (2) 
print x 
lock. release () 
lock =threading.RLock() £ lock =threading.Lock () 
u- 
for i in range(10): 
t -mythread() 
tl.append(t) 
x-0 
foriintl: 
i.start() 


为 了 节省 篇 幅 , 这 里 就 不 给 出 运行 结果 了 ,您 可 以 运行 上 面 的 程序 ,然后 把 lock. acquire() 
fll lock. release() 这 两 行 注释 掉 再 运行 ,比较 两 次 结果 的 不 同 。 


13.3.2 Condition 对 象 


使 用 Condition 对 象 可 以 在 某 些 事 件 触 发 后 才 处 理 数 据 ,可 以 用 于 不 同 线程 之 间 的 通 
信和 或 通知 ,以 实现 更 高 级 别 的 同步 。Condition 对 象 除了 具有 acquire() 和 release() 方 法 之 
外 ,还 有 wait() ,notifyO Al notify_all() 等 方法 。 下 面 通过 经 典 生产 者 -消费 者 问题 来 演示 
Condition 对 象 的 用 法 。 

首先 实现 生产 者 线程 类 : 


import threading 


class Producer (threading.Thread) : 
def init (self, threadname): 
threading.Thread. init  (self,name-threadname) 
def run(self): 
global x 
con.acquire () 
if x ==20: 
con.wait () 
else: 
print 'AnProducer:', 
for i in range (20) : 
print x, 
x=x +1 
print x 
con.notify() 


con.release() 
接 下 来 实现 消费 者 线程 类 : 


class Consumer (threading.Thread) : 
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def init (self, threadname): 


threading.Thread. init (self, name —threadname) 


def run (self) : 
global x 
con.acquire () 


if x==0: 
con.wait () 
else: 
print '\nConsumer:', 
for i in range (20): 
print x, 
x=x-1 
print x 
con.notify() 


con.release() 
创建 Condition 对 象 以 及 生产 者 线程 和 消费 者 线程 。 


con =threading.Condition () 
x=0 

p = Producer (' Producer') 

c =Consumer ('Consumer') 
p.start () 

c.start() 

p.join() 

c.join() 


print 'After Producer and Consumer all done:',x 


该 程序 的 运行 结果 如 图 13-3 所 示 。 


Producer: 012 345 6 7 8 9 10 11 12 13 14 


Consumer: 20 19 18 17 16 15 14 13 12 11 10 9 


After Producer and Consumer all done: 0 


15 16 17 18 19 20 


876543210 


图 13-3 ”使 用 Condition 实现 线程 同步 


13.3.3 Queue 对象 
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Queue 模块 (在 Python 3 中 为 queue 模块 ) 实 现 了 多 生产 者 -多 消费 者 队列 ,尤其 适合 
需要 在 多 个 线程 之 间 进 行 信息 交换 的 场合 ,该 模块 的 Queue 对 象 实现 了 多 线程 编程 所 需要 
的 所 有 锁 语义 。 下 面 的 Python 2. 7. 8 代码 演示 了 Queue 对 象 的 用 法 。 


import threading 
import time 
import Queue # queue in Python3 


class Producer (threading.Thread) : 
def init (self, threadname): 
threading.Thread. init (self, name —threadname) 
def run (self) : 
global myqueue 
myqueue.put (self .getName () ) 
print self.getName(), ' put ', self.getName(), ' to queue. ' 


class Consumer (threading.Thread) : 
def init (self, threadname): 
threading.Thread. init (self, name =threadname) 
def run(self): 
global myqueue 
print self.getName(), ' get ', myqueue.get(), ' from queue." 
myqueue - Queue .Queue () 
plist = [] 
clist - [] 


for i in range (10): 
p 7 Producer ('Producer' + str (i)) 
plist.append(p) 
c =Consumer ('Consumer' + str (i)) 


clist.append(c) 


for i in plist: 
i.start() 
i.join() 

for i in clist: 
i.start() 


i.join() 
上 面 的 程序 运行 结果 如 下 : 


Producer0 put Producer0 to queue. 
Producerl put Producerl to queue. 
Producer2 put Producer? to queue. 
Producer3 put Producer3 to queue. 
Producer4 put Producer4 to queue. 
Producer5 put Producer5 to queue. 
Produceré put Producer6 to queue. 
Producer? put Producer? to queue. 
Producer8 put Producer8 to queue. 
Producer9 put Producer9 to queue. 
Consumer0 get Producer0 from queue. 
Consumerl get Producerl from queue. 
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Consumer2 get Producer? from queue. 
Consumer3 get Producer3 from queue. 
Consumer4 get Producer4 from queue. 
Consumer5 get Producer5 from queue. 
Consumer6 get Produceré from queue. 
Consumer? get Producer? from queue. 
Consumer8 get Producer8 from queue. 


Consumer9 get Producer9 from queue. 


13.3.4 Event 对 象 


Event 对 象 是 一 种 简单 的 线程 通信 技术 ,一 个 线程 设置 Event 对 象 , 另 一 个 线程 等 待 
Event 对 象 。Event 对 象 的 set() 方 法 可 以 设置 Event 对 象 内 部 的 信号 标志 为 真 ;clear() 方 
法 可 以 清除 Event 对 象 内 部 的 信号 标志 ,将 其 设置 为 假 :isSet() 方 法 用 来 判断 其 内 部 信号 标 
志 的 状态 ;wait() 方 法 只 有 在 其 内 部 信号 状态 为 真 时 将 很 快 地 执行 并 返回 , 若 Event 对 象 的 
内 部 信号 标志 为 假 , wait() 方 法 将 一 直 等 待 至 超时 或 内 部 信号 状态 为 真 。 

下 面 的 代码 演示 了 Event 对 象 的 用 法 : 


import threading 
class mythread (threading.Thread): 
def init (self, threadname): 
threading.Thread. init__(self, name =threadname) 
def run(self): 
global myevent 
if myevent.isSet(): 
myevent.clear() 
myevent.wait () 
print self.getName () 
else: 
print self.getName () 
myevent.set () 


myevent = threading.Event () 
myevent.set () 
u- 
for i in range (10): 
t =mythread (str (i)) 
t1.append (t) 


for i intl: 
i.start() 


将 上 面 的 代码 保存 为 ThreadSynchronizationUsingEvent. py 文件 并 运行 ,您 会 发 现 每 
次 的 运行 结果 略 有 不 同 , 图 13-4 是 其 中 一 次 的 运行 结果 。 
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果 件 \Python\code F t chro t ngevent .py 


图 13-4 使 用 Event 对 象 实现 线程 同步 


CD 线程 数量 并 不 是 越 多 越 好 。 

(2) threading 模块 是 Python 支持 多 线程 编程 的 重要 模块 ,提供 了 Thread, Lock, 
RLock,Condition, Event, Timer, Semaphore 等 大 量 类 和 对 象 

(3) Thread 类 支持 两 种 方法 来 创建 线程 : 一 种 方法 是 为 其 构造 函数 传递 一 个 可 调用 对 
象 ; 另 一 种 方法 是 继承 Thread 类 并 在 派生 类 中 重 写 _init OM run() 方 法 。 

(4) 创建 了 线程 对 象 之 后 ,可 以 调用 其 start() 方 法 来 启动 该 线程 ,join() 方 法 用 来 等 待 
线程 结束 或 超时 。 

(5) 可 以 通过 设置 线程 的 daemon 属性 来 决定 主线 程 结束 时 是 die S I 束 ， 
daemon 属性 的 值 默认 为 False, 即 主线 程 结束 时 检查 并 P 
daemon 属性 的 值 则 必须 在 调用 start() 方 法 之 前 进行 修改 

(6) 除了 threading 模块 中 提供 的 线程 同步 对 象 之 外 ,Queue 或 queue 模块 也 实现 了 多 
生产 者 -多 消费 者 队列 ,尤其 适合 需要 在 多 个 线程 之 间 进 行 信息 交换 的 场合 。 


习 是 


. 叙述 创建 线程 的 方法 。 

. SU Thread 对 象 的 方法 

. 叙述 线程 对 象 的 daemon 属性 的 作用 和 影响 
A. 解释 至 少 3 种 线程 同步 方法 
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毫 无 疑问 ,数据 库 技 术 的 发 展 为 各 行 各 业 都 带 来 了 很 大 方便 ,数据 库 不 仅 支持 各 类 数据 
的 长 期 保存 ,更 重要 的 是 支持 各 种 跨 平 各、 跨 地 域 的 数据 查询 ,共享 以 及 修改 , 极 大 方便 了 人 
类 生活 和 工作 。 金 融 行业 、 聊 天 系统 、 各 类 网 站 、 办 公 自 动 化 系统 .各 种 管理 信息 系统 等 ,都 
少不了 数据 库 技 术 的 支持 。 本 章 主 要 介绍 SQLite, Access, MySQL, MS SQL Server 等 几 
种 数据 库 的 Python 接口 ,并 通过 几 个 示例 来 演示 数据 的 增删 、 改 . 查 等 操作 。 为 了 节省 篇 
幅 ,本 章 并 没有 详细 介绍 数据 库 的 原理 、 概 念 以 及 SQL 语句 的 语法 ,而 是 假设 读者 已 经 了 解 
或 者 可 以 通过 查阅 相关 资料 学 习 这 部 分 内 容 。 


14.1 SQLite 应 用 


SQLite 是 内 内 在 Python 中 的 轻 量 级 .基于 磁盘 文件 的 数据 库 管理 系统 ,不 需要 服务 器 
进程 ,支持 使 用 SQL 语句 来 访问 数据 库 。 该 数据 库 使 用 C 语言 开发 ,支持 大 多 数 SQL91 标 
准 , 支 持原 子 的 ,一 致 的 .独立 的 和 持久 的 事务 ,不 支持 外 键 限制 ;通过 数据 库 级 的 独占 性 和 
共享 锁定 来 实现 独立 事务 , 当 多 个 线程 同时 访问 同一 个 数据 库 并 试图 写 和 人 数据 时 ,每 一 时 刻 
只 有 一 个 线程 可 以 写 人 数据 。 

SQLite 支持 2TB 大 小 的 单个 数据 库 ,每 个 数据 库 完全 存储 在 单个 磁盘 文件 中 ,以 B+ 
树 数据 结构 的 形式 存储 ,一 个 数据 库 就 是 一 个 文件 ,通过 简单 复制 即 可 实现 数据 库 的 备份 。 
如 果 需 要 使 用 可 视 化 管理 工具 ,请 下 载 并 使 用 SQLiteManager, SQLite Database Browser 
或 其 他 类 似 工 具 。 如 果 使 用 Python 程序 读 取 SQLite 记录 时 显示 乱码 ,可 以 尝试 修改 程序 
并 使 用 UTF-8 编码 格式 。 

访问 和 操作 SQLite 数据 时 ,需要 首先 导入 sqlite3 模块 ,然后 就 可 以 使 用 其 中 的 功能 来 
操作 数据 库 了 ,该 模块 提供 了 与 DB-API 2. 0 规范 兼容 的 SQL 接口 。 

使 用 该 模块 时 ,首先 需要 创建 一 个 与 数据 库 关联 的 Connection 对 象 ,例如 : 


import sqlite3 
conn = sqlite3.connect ('example.db') 


成 功 创建 Connection 对 象 以 后 ,再 创建 一 个 Cursor 对 象 , 并 且 调 用 Cursor 对 象 的 


execute() 方 法 来 执行 SQL 语句 创建 数据 表 以 及 查询 、 插 入 、 修 改 或 删除 数据 库 中 的 数据 ， 
例如 : 


c= conn.cursor () 

# 创 建 表 

c.execute(" CREATE TABLE stocks (date text, trans text, symbol text, qty real, 
price real) ™) 

# 插 入 一 条 记录 

c.execute ("INSERT INTO stocks VALUES ('2006- 01- 05' , 'BUY' , 'RHAT' , 100, 35.14) ") 


数据 库 编程 


# 提 交 当 前 事务 ,保存 数据 

conn.commit () 

# 关 闭 数据 库 连 接 

conn.close() 

如 果 需 要 查询 表 中 内 容 , 那 么 重新 创建 Connection 对 象 和 Cursor 对 象 之 后 ,可 以 使 用 
下 面 的 代码 来 查询 : 


>>> for row in c.execute('SELECT * FROM stocks ORDER BY price'): 


print (row) 


接 下 来 重点 介绍 sqlite3 模块 中 的 Connection, Cursor 和 Row 等 对 象 。 


14.1.1 Connection 对 象 
Connection 是 sqlite3 模块 中 最 基本 也 是 最 重要 的 一 个 类 ,其 主要 方法 如 表 14-1 所 示 。 
表 14-1 Connection 对 象 主要 方法 
方 ” 法 说 OW 
sqlite3. Connection. execute(sql[ ，parameters]) | 执行 一 条 SQL 语句 


sqlite3. Connection. executemany(sql[，parameters]) | 执行 多 条 SQL 语句 

sqlite3. Connection. cursor() 返回 连接 的 游标 

提交 当前 事务 ,如 果 不 提 交 的 话 ,那么 自 上 次 调用 commit() 
方法 之 后 的 所 有 修改 都 不 会 真正 保存 到 数据 库 中 

撤销 当前 事务 ,将 数据 库 恢 复 至 上 次 调用 commit( ) 方 
法 后 的 状态 

sqlite3. Connection. close() 关闭 数据 库 连 接 

创建 可 在 SQL 语句 中 调用 的 函数 ,其 中 name 为 函数 


名 ,num_params 表示 该 函数 可 以 接收 的 参数 个 数 func 
表示 Python 可 调用 对 象 


sqlite3. Connection. commit() 


sqlite3. Connection. rollback() 


sqlite3. Connection. create_function(names 
num_params, func) 


Connection 对 象 的 其 他 几 个 函数 都 比较 容易 理解 ,下 面 的 代码 演示 了 如 何在 sqlite3 连 
接 中 创建 并 调用 自 定义 函数 : 


import sqlite3 
import hashlib 


def md5sum(t) : 
return hashlib.md5 (t) .hexdigest () 


con = sqlite3.connect (":memory:") 

con.create function ("md5", 1, md5sum) 

cur =con.cursor () 

cur.execute ("select md5(?)", (b"foo",)) +E soL 语句 中 调用 自 定义 函数 
print (cur.fetchone () [0]) 
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14.1.2 Cursor 对 和 象 
Cursor 也 是 sqlite3 模块 中 比较 重要 的 一 个 对 象 , 该 对 象 具有 如 下 常用 方法 。 


1. execute(sql[ . parameters ]) 
该 方法 用 于 执行 一 条 SQL 语句 ,下 面 的 代码 演示 了 该 方法 的 用 法 ,以 及 为 SQL 语句 传 
递 参数 的 两 种 方法 ,分 别 使 用 问号 和 命名 变量 作为 占 位 符 。 


import sqlite3 


con =sqlite3.connect (" :memory:") 

cur =con.cursor () 

cur.execute ("create table people (name last, age)") 

who = "Dong" 

age =38 

# 使 用 问号 作为 占 位 符 

cur.execute ("insert into people values (?, ?)", (who, age)) 
# 使 用 命名 变量 作为 占 位 符 

cur.execute("select * from people where name last- :who and age=:age", {"who": who, "age": 
agel) 

print (cur.fetchone ()) 


运行 结果 如 图 14-1 所 示 o 


p»» ================================ RESTART ===: 
>>> 
(u'Dong', 38) 

2 


图 14-1 运行 结果 


2. executemany(sql. seq of parameters) 
该 方法 用 来 对 所 有 给 定 参 数 执行 同一 个 SQL 语句 ,该 参数 序列 可 以 使 用 不 同 的 方式 产 
生 , 例 如 ,下 面 的 代码 使 用 迭代 来 产生 参数 序列 : 


import sqlite3 


class IterChars: 

def init (self): 
self.count =ord('a') 

def iter (self): 
return self 

def next (self): 
if self.count » ord('z'): 

raise StopIteration 

self.count +=1 


return (chr(self.count ~1),)#this is a 1- tuple 


con = sqlite3.connect (" :memory:") 
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cur —con.cursor () 
cur.execute ("create table characters (c)") 

theIter = IterChars () 

cur.executemany ("insert into characters (c) values (?)", theIter) 
cur.execute ("select c from characters") 


print (cur.fetchall()) 
下 面 的 代码 则 使 用 了 更 为 简洁 的 生成 器 来 产生 参数 : 


import sqlite3 
import string 


def char generator(): 

for c in string.ascii lowercase: 

yield (c,) 

con = sqlite3.connect (":memory:") 
cur =con.cursor () 
cur.execute ("create table characters (c) ") 
cur.executemany ("insert into characters (c) values (?)", char generator()) 
cur.execute ("select c from characters") 
print (cur.fetchall ()) 


下 面 的 代码 则 使 用 直接 创建 的 序列 作为 SQL 语句 的 参数 : 


import sqlite3 


persons = [ 
("Hugo", "Boss"), 
("Calvin", "Klein") 
] 
con =sqlite3.connect (":memory:") 
HUER 
con.execute ("create table person (firstname, lastname) ") 
# 插 入 数据 
con.executemany ("insert into person (firstname, lastname) values (?, ?)", persons) 
# 显 示 数 据 
for row in con.execute ("select firstname, lastname from person"): 
print (row) 


print("I just deleted", con.execute ("delete from person").rowcount, "rows") 
运行 结果 如 图 14-2 所 示 o 
3. fetchone() ,fetchmany (size= cursor. arraysize) ,fetchall() 


这 3 个 方法 用 来 读 取 数 据 。 假 设 数据 库 通过 下 面 的 代码 创建 并 插入 数据 : 


import sqlite3 
conn = sqlite3.connect ("D: /addressBook.db") 
cur —conn.cursor () 


cur.execute ("insert into addressList(name , sex , phon, QQ, address) values 
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b>> 
|>>> 
(u'Hugo', u'Boss') 
(u'Calvin', u'Klein') 
I just deleted 2 rows 
>>> 


图 14-2 运行 结果 


CENT", UE, 713888997011! , '66735' ，' 北 京 市 ' ) 中 

cur.execute ("insert into addressList (name, sex, phon, QQ, address) values 
CER", "he", '15808066055', '675797', "KET ') ™) 

cur.execute ("insert into addressList (name, sex, phon, QQ, address) values 
(BBR, Hs, 115912108090", 13232099", "BAA TH') ") 

conn.commit () 


conn.close () 
则 下 面 的 代码 演示 了 使 用 fetchall() 读 取 数 据 的 方法 : 


import sqlite3 
conn= sqlite3.connect ('D: /addressBook.db') 
cur- conn.cursor () 
cur.execute('select * from addressList') 
li-cur.fetchall() 
for line in li: 
for item in line: 
if type (item) !=unicode: 
s=str (item) 
else: 
s=item 
print st 'Nt', 
print 


conn.close() 


14.1.3 Row 对象 
下 面 通过 一 个 示例 来 演示 Row 对 象 的 用 法 ,假设 数据 以 下 面 的 方式 创建 并 插入 数据 ， 


conn = sqlite3.connect (":memory:") 

c =conn.cursor () 

c.execute ("create table stocks (date text, trans text, symbol text, qty real, 
price real) ™) 

c.execute ("insert into stocks values ('2006- 01-05", 'BUY', "RHAT', 100, 35. 14) """) 
conn.commit () 


c.close() 
那么 ,可 以 使 用 下 面 的 方式 来 读 取 其 中 的 数据 : 


»»»conn.row factory = sqlite3.Row 
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>>>c =conn.cursor () 

>>>c.execute ("select * from stocks") 
<sqlite3.Cursor object at 0x7f4e7dd8fa80> 
>>> x =c.fetchone () 

>>> type (r) 

<class 'sqlite3.Row'> 

>>> tuple (r) 

('2006- 01-05", 'BUY', 'RHAT', 100.0, 35.14) 


>>> len (r) 

5 

>>> r[2] 

'RHAT' 

>>> r.keys () 

['date', 'trans', 'symbol', 'qty', 'price'] 

>>> r['qty"] 

100.0 

>>> for member in r: 
print (member) 

2006- 01- 05 

BUY 

RHAT 

100.0 

35.14 


14.2 访问 其 他 类 型 数据 库 


除了 SQLite 数据 库 以 外 ,Python 还 可 以 操作 Access, MS SQL Server 和 MySQL 等 多 
种 类 型 的 数据 库 ,本 节 中 对 几 种 常见 的 接口 逐一 进行 简单 介绍 。 


14.2.1 操作 Access 数据 库 


首先 需要 安装 Python for Windows extensions, 即 pywin32。 然 后 可 以 参考 下 面 的 步 
又 和 方式 来 访问 Access 数据 库 。 
1. 建立 数据 库 连 接 


import win32com.client 

conn —win32com.client.Dispatch(r'ADODB.Connection') 

DSN = 'PROVIDER-Microsoft.Jet.OLEDB.4.0;DATA SOURCE- C: /MyDB.mdb; ' 
conn.Open (DSN) 


2. 打开 记录 集 


rs —win32com.client.Dispatch (r'ADODB.Recordset') 
rs name = 'MyRecordset' RY 


rs.Open('[' +rs name t ']', conn, 1, 3) 
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3. 操作 记录 集 


rs.AddNew () 
rs.Fields.Item(1) .Value = 'data' 
rs.Update () 


4. 操作 数据 


conn —win32com.client.Dispatch(r'ADODB.Connection') 
DSN = 'PROVIDER-Microsoft.Jet.OLEDB.4.0;DATA SOURCE- C: /MyDB .mdb; ' 

sql statement = "insert into [Table Name] ([Field 1], [Field 2]) values ('datal', 
'data2')" 

conn.Open (DSN) 

conn.Execute (sql statement) 


conn.Close () 
5. 遍历 记录 
rs.MoveFirst () 
count =0 
while 1: 
if rs.EOF: 
break 
else: 
count =count +1 


rs .MoveNext () 

在 操作 Access 数据 库 时 ,如 果 一 个 记录 集 是 空 的 ,那么 将 指针 移动 到 第 一 个 记录 将 导 
致 一 个 错误 ,因为 此 时 recordcount 是 无 效 的 。 解 决 的 方法 : 打开 一 个 记录 集 之 前 , 先 将 
Cursorlocation 设置 为 3, 然后 再 打开 记录 集 ,此 时 recordcount 将 是 有 效 的 。 

r3.Cursorlocation =3 


rs.Open('select * from [Table Name]', conn) # 确 保 conn 处 于 打开 状态 


rs.RecordCount 


14.2.2 操作 MS SQL Server 数据 库 


可 以 使 用 pywin32 和 pymssql 两 种 不 同 的 方式 来 访问 MS SQL Server 数据 库 。 
先 来 了 解 一 下 pywin32 模块 访问 MS SQL Server 数据 库 的 步骤 。 
1. 添加 引用 


import adodbapi 
adodbapi .adodbapi .verbose =False #adds details to the sample printout 
import adodbapi.ado consts as adc 


2. 创建 连接 


Cfg = {'server':'192.168.29.86\\eclexpress', 'password' :'xxxx','db':'pscitemp'] 
constr = r"Provider= SQLOLEDB.1; Initial Catalog- $s; Data Source- $s; user ID- $3; Password- $ 
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s; "5$ (C£g['db'], C£g['server'], 'sa', Cfg['password']) 


conn —adodbapi .connect (constr) 
3. 执行 sql 语句 


cur =conn.cursor () 
sql ="select * from softextBook where title '(0]' and remark3!- '(1)' ". 
format (bookName, flag) 

cur.execute (sql) 

data -cur.fetchall() 


cur.close() 
4. 执行 存储 过 程 


# 假 设 proName 有 3 个 参数 ,最 后 一 个 参数 传 了 None. 
ret =cur.callproc('procName', (parml,parm2,None)) 


conn.commit () 
5. 关闭 连接 


conn.close () 


接 下 来 再 通过 一 个 示例 来 简单 了 解 一 下 使 用 pymssql 模块 访问 MS SQL Server 数据 库 的 
方法 。 


import pymssql 
conn = pymssql. connect (host- 'SQLO1', user- 'user', password- ' password ', database- ' 
mydatabase') 
cur =conn.cursor() 
cur.execute ('create table persons (id INT, name VARCHAR (100) ) ') 
cur.executemany ("insert into persons values ($d, xinos.king)", [ (1, 'John Doe"), (2, 'Jane Doe 
?»n 
conn.commit () 
cur.execute('select * from persons where salesrep- xinos.king', 'John Doe') 
row =cur.fetchone () 
while row: 
print "ID=%d, Name=xinos.king" %(row[0], row[1]) 
row =cur.fetchone() 
cur.execute ("select * from persons where salesrep like 'J$'") 


conn.close () 


14.2.3 操作 MySQL 数据 库 


Python 访问 MySQL 数据 库 可 以 使 用 MySQLDb 模块 ,该 模块 的 主要 方法 有 10 个 。 

(1) commitO ; 提交 事务 。 

(2) rollbackO ; 回 滚 事务 。 

(3) callproc(self, procname, args): 用 来 执行 存储 过 程 ,接收 的 参数 为 存储 过 程 名 和 
参数 列表 ,返回 值 为 受 影响 的 行 数 。 
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(4) execute(self, query, args): 执行 单条 SQL 语句 ,接收 的 参数 为 SQL 语句 本 身 和 
使 用 的 参数 列表 ,返回 值 为 受 影响 的 行 数 。 

(5) executemany(self, query, args): 执行 单条 SQL 语句 ,但 是 重复 执行 参数 列表 里 
的 参数 ,返回 值 为 受 影响 的 行 数 。 

(6) nextset(self) : 移动 到 下 一 个 结果 集 。 

(7) fetchall(self) : 接收 全 部 的 返回 结果 行 。 

(8) fetchmany(self, size— None): 接收 size 条 返回 结果 行 ,如 果 size 的 值 大 于 返回 的 
结果 行 的 数量 , 则 会 返回 cursor. arraysize 条 数据 。 

(9) fetchone(self) : 返回 一 条 结果 行 。 

(10) scroll(self, value. mode— relative) : 移动 指针 到 某 一 行 ,如 果 mode 二 'relative'， 
则 表示 从 当前 所 在 行 移动 value 条 ; 如果 mode 二 "absolute", 则 表示 从 结果 集 的 第 一 行 移动 
value 条 。 

使 用 该 模块 查询 MySQL 数据 库 记 录 的 方法 如 下 : 


import MySQLdb 
try: 
conn- MySQLdb.connect (host- 'localhost',user- 'root',passwd- 'root', 
db- 'test',port- 3306) 
cur- conn.cursor () 
cur.execute('select * from user') 
cur.close() 
conn.close() 
except MySQLdb.Error,e: 
print "Mysql Error $d: $s" $(e.args[0], e.args[1]) 


插入 数据 的 用 法 如 下 : 


import MySQLdb 

try: 
conn- MySQLdb.connect (host- 'localhost',user- 'root',passwd- 'root',port- 3306) 
cur- conn.cursor () 
cur.execute ('create database if not exists python') 
conn.select db('python') 
cur.execute ('create table test (id int, info varchar (20) ) ') 
value- [1, 'hi rollen'] 
cur.execute ('insert into test values ($s,$3) ', value) 
values- [] 
for i in range (20): 

values.append|((i, "hi rollen'+ str (i))) 

cur.executemany ('insert into test values (%s,%s) ',values) 
cur.execute ("update test set info="I am rollen" where id-3') 
conn.commit () 
cur.close() 


conn.close () 
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except MySQLdb.Error,e: 
print "MySQL Error èd: $s" $(e.args[0], e.args[1]) 


本 章 知 识 精 要 


(D SQLite ARRE Python 中 的 轻 量 级 .基于 磁盘 文件 的 数据 库 管 理 系统 ,不 需要 服 
务 器 进程 ,支持 使 用 SQL 语句 来 访问 数据 库 。 

(2) 访问 和 操作 SQLite 数据 库 时 ,需要 首先 导入 sqlite3 模块 。 

(3) 可 以 使 用 pywin32 模块 来 操作 Access 数据 库 和 MS SQL Server 数据 库 ,也 可 以 使 
用 pymssql 模块 来 操作 MS SQL Server 数据 库 。 

(4) 可 以 使 用 MySQLDb 模块 操作 MySQL 数据 库 。 


HW 


1. 简单 介绍 SQLite 数据 库 。 

2. 使 用 Python PY Ei PR dir() 查 看 Cursor X$ 4 P WY 77 we. AE JA PY PHBE helpO $t 
看 其 用 法 。 

3. 叙述 使 用 Python 操作 Access 数据 库 的 步骤 。 

4. 叙述 使 用 Python 操作 MS SQL Server 数据 库 的 步骤 。 

5. 叙述 MySQLDb 模块 提供 的 数据 库 访问 方法 。 
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第 15 章 多 媒体 编程 


在 本 章 中 ,主要 介绍 图 形 编程 .图 像 编程 .音乐 编程 以 及 声音 处 理 与 语音 识别 等 模块 和 
技术 。 本 章 中 用 到 的 大 部 分 模块 不 是 默认 安装 的 ,请 根据 需要 下 载 并 安装 相应 的 模块 。 


15.1 图 形 编程 


计算 机 图 形 学 主要 研究 如 何 使 用 计算 机 来 生成 具有 真实 感 的 图 形 , 涉 及 的 内 容 主 要 包 
括 三 维 建 模 、 图 形变 换 、 光 照 模型 纹理 映射 和 阴影 模型 等 内 容 , 在 机 械 制 造 、 虚 拟 现实 、 游 戏 
开发 .漫游 系统 设计 \ 产 品 展示 等 多 个 领域 具有 重要 的 应 用 。 随 着 3D 打印 机 的 诞生 ,只 要 
有 模型 就 能 够 快速 生成 实物 ,这 无 疑 会 大 大 扩展 计算 机 图 形 学 的 应 用 范围 ,例如 ,可 以 使 用 
计算 机 图 形 学 制作 出 各 种 可 爱 的 模型 ,然后 参照 这 些 模 型 使 用 3D 打印 机 批量 生产 各 种 食 
品 、 玩 偶 和 饰品 等 。 目 前 大 部 分 计算 机 图 形 学 的 书籍 都 是 基于 OpenGL 的 ,Python 也 提供 
了 PyOpenGL, 这 极 大 地 方便 了 编写 图 形 学 程序 的 Python 程序 员 。 


15.1.1 创建 图 形 编程 框架 


Python 的 跨 平台 扩展 模块 PyOpenGL 封装 了 OpenGL API, 支 持 图 形 编程 所 需要 的 所 
有 功能 。 使 用 该 模块 进行 图 形 编程 的 步骤 如 下 。 
(1) 导入 模块 。 


from OpenGL.GL import * 
from OpenGL.GLU import * 
from OpenGL.GLUT import * 
import sys 


(2) 使 用 OpenGL 创建 窗口 类 。 
class MyPyOpenGLTest: 
(3) 重 写 构造 函数 ,初始 化 OpenGL 环境 ,指定 显示 模式 以 及 用 于 绘图 的 函数 。 


def init (self, width =640, height =480, title = 'MyPyOpenGLTest'): 
glut Init (sys.argv) 
glut InitDisplayMode (GLUT RGBA | GLUT DOUBLE | GLUT DEPTH) 
glut InitWindowSize (width, height) 
self.window =glutCreateWindow (title) 
glutDisplayFunc (self.Draw) 
glutIdleFunc (self.Draw) 


self.InitGL (width, height) 


CD 根据 特定 的 需要 ,进一步 完成 OpenGL 的 初始 化 。 


def InitGL (self, width, height): 
glClearColor (0.0, 0.0, 0.0, 0.0) 
glClearDepth (1.0) 
glDepthFunc(GL LESS) 
glShadeModel(GL SMOOTH) 
glEnable(GL POINT SMOOTH) 
glEnable(GL LINE SMOOTH) 
glEnable(GL POLYGON SMOOTH) 
glMatrixMode (GL PROJECTION) 
glHint(GL POINT SMOOTH HINT,GL NICEST) 
glHint(GL LINE SMOOTH HINT,GL NICEST) 
glHint(GL POLYGON SMOOTH HINT,GL FASTEST) 
glLoadIdentity() 
gluPerspective (45.0, float (width) /float (height), 0.1, 100.0) 
glMatrixMode (GL MODELVIEW) 


(5) 定义 自己 的 绘图 函数 。 


def Draw (self) : 
glClear (GL COLOR BUFFER BIT | GL DEPTH BUFFER BIT) 
glLoadIdentity () 
glutSwapBuffers () 


(6) 消息 主 循环 。 


def MainLoop (self): 
glutMainLoop () 


(7) 实例 化 窗口 类 ,运行 程序 。 


if name --' main ': 


w —MyPyOpenGLTest () 
w.MainLoop() 


15.1.2 绘制 文字 


可 以 使 用 glutBitmapCharacter() 函 数 在 绘图 窗口 上 绘制 文字 ,该 函数 每 次 只 能 绘制 一 
个 字符 ,可 以 使 用 循环 结构 来 输出 多 个 字符 。 改 写 前 面 图 形 编程 框架 中 的 Draw © 函数, 就 
可 以 实现 该 功能 。 


def Draw (self) : 
giClear(GL COLOR BUFFER BIT | GL DEPTH BUFFER BIT) 
glLoadIdentity() 
giColor3f (1.0, 1.0, 1.0) 
giTranslatef (0.0, 0.0, - 1.0) 
glRasterPos2f (0.0, 0.0) 
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s = 'PYOpenGL is the binding layer between Python and OpenGL." 


for chin s: 


glutBitmapCharacter(GLUT BITMAP 8 BY 13, ord(ch)) 


15.1.3 绘制 图 形 


在 OpenGL 中 绘制 图 形 的 代码 需要 放 在 glBegin(mode) 和 glEnd() 这 一 对 函数 的 调用 
之 间 , 其 中 mode 表示 绘图 类 型 , 取 值 范围 如 表 15-1 所 示 。 


表 15-1 mode 取 值 
取 ff 说 OW m 值 说 OW 
GL POINTS 绘制 点 GL TRIANGLE STRIP | 绘制 三 角形 串 
GL_LINES 绘制 直线 GL TRIANGLE FAN | 绘制 三 角 扇 形 
GL_LINE_STRIP 绘制 连续 直线 ,不 封闭 | GL_QUADS 绘制 四 边 形 
GL_LINE_LOOP 绘制 封闭 的 连续 直线 ”| GL QUAD STRIP 绘制 四 边 形 串 
GL TRIANGLES 绘制 三 角形 GL POLYGON 绘制 多 边 形 


例如 ,将 前 面 给 出 的 图 形 编程 框架 中 的 Draw() 函 数 改写 成 下 面 的 代码 , 则 可 以 绘制 一 
个 彩色 三 角形 和 一 条 彩色 直线 。 在 这 段 代 码 中 ,首先 设置 绘制 模式 为 多 边 形 ,然后 依次 绘制 
该 多 边 形 的 顶点 ,绘制 每 个 顶点 之 前 设置 顶点 颜色 ,最 后 修改 绘制 模式 为 直线 并 指定 直线 段 
的 端点 颜色 和 位 置 。 需 要 注意 的 是 ,使 用 glColor3f() 函数 设置 颜色 之 后 ,直到 下 一 次 使 用 
该 函数 改变 颜色 之 前 ,绘制 的 所 有 项 点 都 使 用 这 个 颜色 。 或 者 说 ,OpenGL 采用 的 是 “状态 
机 ?工作 方式 ,一 旦 设置 了 某 种 状态 之 后 ,除非 显 式 修改 该 状态 ,否则 该 状态 将 一 直 保 持 。 


def Draw (self): 


glClear(GL COLOR BUFFER BIT | GL DEPTH BUFFER BIT) 
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glLoadIdentity () 


glTranslatef (-2.0, 0.0, -8.0) 


# 绘 制 二 维 图 形 ,z 坐标 为 0 
glBegin(GL POLYGON) 
glColor3f (1.0, 0.0, 0.0) 
glVertex3f (0.0, 1.0, 0.0) 
glColor3f (0.0, 1.0, 0.0) 
glVertex3f (1.0, -1.0, 0.0) 
glColor3f (0.0, 0.0, 1.0) 


glVertex3f(-1.0, -1.0, 0.0) 


glEnd() 


glTranslatef (2.5, 0.0, 0.0) 


# 绘 制 三 维 图 形 

glBegin(GL LINES) 
glColor3f (1.0, 0.0, 0.0) 
glVertex3f (1.0, 1.0, -1.0) 
glColor3f (0.0, 1.0, 0.0) 


# 绘 制 多 边 形 
# 4 设置 顶点 颜色 
# 绘 制 多 边 形 顶 点 


# 绘 制 直线 


SRRA 


glVertex3f (-1.0, -1.0, 3.0) 
glEnd() 
glutSwapBuffers () 


上 面 的 代码 运行 结果 如 图 15-1 所 示 o 


=) My 


图 15-1 绘制 图 形 


15.1.4 纹理 映射 


在 现实 中 ,人 们 主要 通过 物体 表面 丰富 的 纹理 细节 来 区 分 具有 相同 形状 的 不 同 物体 。 
在 三 维 建 模 时 也 往往 通过 纹理 映射 来 简化 建 模 的 工作 量 , 可 以 在 保证 图 形 具 有 较 强 真实 感 
的 前 提 下 大 幅度 提高 泻 染 效率 

简单 地 说 ,纹理 映射 就 是 为 物体 表面 进行 贴图 以 使 其 呈现 出 特定 的 视觉 效果 。 这 需要 
首先 准备 好 纹理 ,然后 构建 物体 空间 坐标 和 纹理 坐标 之 的 对 应 关系 来 完成 贴图 。 可 以 使 
用 函数 来 生成 一 些 规则 的 纹理 ,例如 粗布 纹理 、 棋 盘 纹 理 等 ,也 可 以 将 拍摄 或 通过 网 络 搜索 
下 载 的 图 片 作为 纹理 映射 到 物体 表面 上 。 进 行 纹理 映射 之 前 ,首先 要 读 取 并 设置 纹理 数据 。 
在 前 面 给 出 的 图 形 编程 框架 中 增加 如 下 函数 用 来 读 取 和 设置 纹理 数据 : 


def LoadTexture (self): 
img = Image.open (' sample.bmp') 
width, height —img.size 
img -img.tostring('raw', 'RGBX', 0, -1) 
glBindTexture(GL TEXTURE 2D, glGenTextures (1) ) 
glPixelStorei(GL UNPACK ALIGNMENT, 1) 
glTexImage2D(GL TEXTURE 2D, 0, 4, width, height, 0, GL RGBA, GL UNSIGNED BYTE, img) 
glTexParameterf (GL TEXTURE 2D, GL TEXTURE WRAP S, GL CLAMP) 


glTexParameterf (GL TEXTURE 2D, GL TEXTURE WRAP T, GL CLAMP) 
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glTexParameterf(GL TEXTURE 2D, GL TEXTURE WRAP S, GL REPEAT) 
glTexParameterf(GL TEXTURE 2D, GL TEXTURE WRAP T, GL REPEAT) 
glTexParameterf(GL TEXTURE 2D, GL TEXTURE MAG FILTER, GL NEAREST) 
glTexParameterf(GL TEXTURE 2D, GL TEXTURE MIN FILTER, GL NEAREST) 
glTexEnvf(GL TEXTURE ENV, GL TEXTURE ENV MODE, GL DECAL) 


然后 修改 图 形 编 程 框架 中 的 初始 化 函数 ,设置 纹理 映射 属性 ,并 进行 背面 剔除 ,修改 后 的 代 
RT. 


def InitGL (self, width, height): 
self.LoadTexture () 
glEnable(GL TEXTURE 2D) 
glClearColor (0.0, 0.0, 0.0, 0.0) 
glClearDepth (1.0) 
glDepthFunc (GL LESS) 
glShadeModel(GL SMOOTH) 
glEnable (GL CULL FACE) 
glCullFace (GL BACK) ay EAR 
glEnable(GL LINE SMOOTH) 
glEnable(GL POLYGON SMOOTH) 
glMatrixMode (GL PROJECTION) 
glHint(GL LINE SMOOTH HINT,GL NICEST) 
glHint(GL POLYGON SMOOTH HINT,GL FASTEST) 
glLoadIdentity () 
gluPerspective (45.0, float (width) /float (height), 0.1, 100.0) 
glMatrixMode (GL MODELVIEW) 


接 下 来 ,修改 图 形 编程 框架 中 的 Draw() 函 数 ,绘制 立方 体 盒子 ,并 使 用 上 面 代 码 读 取 到 的 纹 
理 数据 进行 表面 映射 ; 


def Draw(self): 
glClear (GL COLOR BUFFER BIT | GL DEPTH BUFFER BIT) 
glLoadIdentity () 
glTranslate (0.0, 0.0, - 9.0) 
glRotatef (self.x, 1.0, 0.0, 0.0) 
glRotatef (self.y, 0.0, 1.0, 0.0) 
glRotatef (self.z, 0.0, 0.0, 1.0) 


# 依 次 绘制 立方 体 的 6 个 面 并 进行 纹理 映射 
glBegin(GL QUADS) 

glTexCoord2f (0.0, 0.0) # 设 置 纹理 坐标 
glVertex3f (- 1.0, -1.0, 1.0) # 指 定 顶点 位 置 
glTexCoord2f (1.0, 0.0) 

glVertex3f (1.0, -1.0, 1.0) 

glTexCoord2f (1.0, 1.0) 

glVertex3f (1.0, 1.0, 1.0) 

glTexCoord2f (0.0, 1.0) 
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glVertex3f (-1.0, 1.0, 1.0) 


glTexCoord2f (1.0, 0.0) 
glVertex3f(-1.0, -1.0, - 1.0) 
glTexCoord2f (1.0, 1.0) 
glVertex3f(-1.0, 1.0, - 1.0) 
glTexCoord2f (0.0, 1.0) 
glVertex3f(1.0, 1.0, -1.0) 
glTexCoord2f (0.0, 0.0) 
glVertex3f (1.0, -1.0, - 1.0) 


glTexCoord2f (0.0, 1.0) 
glVertex3f (-1.0, 1.0, - 1.0) 
glTexCoord2f (0.0, 0.0) 
glVertex3f (-1.0, 1.0, 1.0) 
glTexCoord2f (1.0, 0.0) 
glVertex3f (1.0, 1.0, 1.0) 
glTexCoord2f (1.0, 1.0) 
glVertex3f (1.0, 1.0, - 1.0) 


glTexCoord2f (1.0, 1.0) 
glVertex3f (-1.0, -1.0, -1.0) 
glTexCoord2f (0.0, 1.0) 
glVertex3f (1.0, -1.0, - 1.0) 
glTexCoord2f (0.0, 0.0) 
glVertex3f (1.0, -1.0, 1.0) 
glTexCoord2f (1.0, 0.0) 
glVertex3f (- 1.0, -1.0, 1.0) 


glTexCoord2f (1.0, 0.0) 
glVertex3f (1.0, -1.0, -1.0) 
glTexCoord2f (1.0, 1.0) 
glVertex3f (1.0, 1.0, - 1.0) 
glTexCoord2f (0.0, 1.0) 
glVertex3£ (1.0, 1.0, 1.0) 
glTexCoord2f (0.0, 0.0) 
glVertex3f (1.0, - 1.0, 1.0) 


glTexCoord2f (0.0, 0.0) 
glVertex3f(-1.0, 1.0, - 1.0) 
glTexCoord2f (1.0, 0.0) 
glVertex3f (-1.0, -1.0, 1.0) 
glTexCoord2f (1.0, 1.0) 
glVertex3f(-1.0, 1.0, 1.0) 
glTexCoord2f (0.0, 1.0) 
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glVertex3f(-1.0, 1.0, -1.0) 


glEnd() 
glutSwapBuffers () 


15.1.5 处 理 键盘 /鼠标 事件 


如 果 需 要 使 用 鼠标 或 键盘 来 操作 图 形 ,如 平移 旋转 和 缩放 等 ,那么 首先 需要 在 初始 化 
函数 中 指定 接受 键盘 和 鼠标 事件 的 函数 , 即 增加 下 面 两 行 代码 : 


def init (self, width —640, height —480, title = 'MyPyOpenGLTest'): 


glutKeyboardFunc (self.KeyPress) 
glutMouseFunc (self.Mouse) 


然后 在 窗口 类 中 增加 下 面 的 函数 定义 ,用 来 接受 并 处 理 键盘 和 鼠标 事件 = 


def Mouse (self, button, mode, x, y): 
if button ==GLUT RIGHT BUTTON and mode == GLUT DOWN: 
print 'yes' 
def KeyPress (self, key, x, y): 
print key 


15.2 图 像 编 程 


Python Imaging Library (PIL) 是 支持 Python 的 图 像 处 理 扩展 模块 ,支持 多 种 图 像 格 
式 , 并 提供 非常 强大 的 图 像 处 理 功能 。PIL 模块 需要 单独 进行 安装 后 才能 使 用 ,在 PIL 中 主 
要 提供 Image, ImageChops, ImageColor , ImageDraw , ImagePath , ImageFile, ImageEnhance 
和 PSDraw 以 及 其 他 一 些 模块 来 支持 图 像 的 处 理 。 本 书 编写 时 PIL 模块 的 官方 版 本 只 支持 
Python 2 ,但 也 有 私人 编译 的 Python 3 版 本 。 

使 用 该 扩展 库 时 ,首先 需要 导入 ,例如 : 

>>> from PIL import Image 
接 下 来 ,我 们 通过 儿 个 示例 来 简单 演示 一 下 该 模块 的 用 法 。 

(1) 打开 图 像 文件 。 

>>> im = Image.open ('sample.jpg") 

(2) 显示 图 像 。 

>>> im. show () 

(3) 查看 图 像 信息 。 


»»»print im.format 


JPEG 
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»»»print im.size 


(360, 468) 

(4) 查看 图 像 直方 图 。 
>>> im.histogram() 

(5) 读 取 像 素 值 。 


>>>print im.getpixel((100,50)) 
(124, 126, 123) 


(6) 设置 像素 值 ,通过 读 取 和 修改 图 像 像 素 值 可 以 实现 图 像 点 运算 。 

>>> im.putpixel ( (100,50) , (128,30,120) ) # 第 二 个 参数 用 来 指定 目标 像素 的 颜色 值 
(7) 保存 图 像 文 件 。 

>>> im. save ('sample1.jpg') 

(8) 转换 图 像 格式 。 

>>> im.save('sample.bmp') # 通 过 该 方法 可 以 进行 格式 转换 

(9) 图 像 缩放 。 

>>> iml = im.resize((100,100)) 


(10) 旋转 图 像 ,rotate( ) 方 法 支持 任意 角度 的 旋转 ,而 transpose() 方 法 支持 部 分 特殊 


角度 的 旋转 ,如 90^ 1807 270° le FEA RIKE .垂直 翻转 等 。 


>>> im2 = im. rotate (90) 

>>> im3 = im. transpose (Image.ROTATE_180) #180" 旋 转 

>>> im4 = im.transpose (Image.FLIP LEFT RIGHT) # 水 平 翻 转 
(OD 图 像 裁剪 与 粘贴 。 

>>>box = (120,194, 220,294) 

>>> region = im.crop (box) # 定 义 裁剪 区 域 
>>> region = region.transpose (Image.ROTATE 180) 

>>> im.paste (region, box) # 粘 贴 


>>> im. show () 


例如 ,图 15-2 是 原始 lena 图 像 . 而 图 15-3 是 将 其 中 一 部 分 进行 旋转 180" 以 后 的 结果 ， 


请 注意 左下 角 区 域 图 像 的 变化 。 


aD 将 彩色 图 像 分 离 为 红 、 绿 、 蓝 三 分 量子 图 ,分 离 后 每 个 图 像 大 小 与 原 图 像 一 样 ,但 


是 只 包含 一 个 颜色 分 量 。 


»»»r,g,b =im.split () 
a3 图 像 增强 。 


>>> from PIL import ImageFilter 
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图 15-2 原始 lena 图 像 


15-3 ”部 分 区 域 被 旋转 180" 以 后 的 lena 图 像 


>>> im5 = im. filter (ImageFilter.DETAIL) 
(14) 图 像 模 糊 。 

>>> im6 = im. filter (ImageFilter.BLUR) 

(15) 图 像 边缘 提取 。 

>>> im7 = im. filter (ImageFilter.FIND EDGES) 
(16) 图 像 点 运算 ,整体 变 暗 或 变 亮 。 


>>> im8 = im.point (lambda i:i* 1.3) 


— 1244 


>>> im9 = im.point (lambda i:i* 0.7) 


也 可 使 用 图 像 增强 模块 来 实现 上 面 的 功能 ,例如 : 


>>> from PIL import ImageEnhance 
>>>enh = ImageEnhance.Brightness (im) 


>>> enh -enhance (1.3) .show() 
(17) 图 像 冷暖 色调 调整 。 


»»»r,g,b-im.split() 
»»»r -r.point (lambda i:i* 1.3) 

»»»g =g-point (lambda i:i * 0.9) 

>>>b =b.point (lambda i:0) 

>>> im10 = Image.merge (im.mode, (r,g,b)) 
>>> im10.show () 


(18) 图 像 对 比 度 增强 。 


>>> im = Image.open (' sample.jpg') 
>>> im.show() 

>>> from PIL import ImageEnhance 
»»»enh = ImageEnhance Contrast (im) 
»»»enh.enhance (1.3) . show () 


15.3 音乐 编程 


多 媒体 编程 


pygame 模块 的 mixer 模块 提供 了 支持 音乐 文件 播放 的 功能 ,可 以 参考 下 面 的 网 址 下 载 


pygame 模块 并 了 解 pygame 模块 更 多 的 知识 和 用 法 。 


http://pygame.org/ftp/ 


http://eyehere.net/2011/python- pygame- novice- professional- index/ 


http://www.pygame.org/docs/ref/ 


pygame 模块 除了 提供 mixer 模块 支持 音乐 播放 之 外 ,还 包含 了 大 量 其 他 支持 游戏 编程 


的 模块 ,如 表 15-2 所 示 。 


表 15-2 pygame 主要 模块 


BOE 说 明 BOE go" 
display 屏幕 显示 time 时 间 控 制 

event 事件 处 理 cursors 控制 鼠标 指针 
image 图 像 处 理 transform 修改 和 移动 图 像 
mouse 鼠标 消息 处 理 key 读 取 键 盘 按键 
movie 视频 文件 播放 ,需要 安装 PyMedia | font 使 用 字体 

surface 绘制 屏幕 
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pygame 模块 中 用 于 音乐 播放 有 关 的 方法 主要 在 mixer 模块 中 ,如 表 15-3 所 示 。 
表 15-3 pygame. mixer 的 主要 方法 


方 法 说 明 
pygame. mixer. init 初始 化 ,必须 最 先 调用 
pygame. mixer. music. load(filename) 打开 音乐 文件 
pygame. mixer. music. play(count, start) 播放 音乐 文件 
pygame. mixer. music. stop() 停止 播放 
pygame. mixer. music. pause() 暂停 播放 
pygame. mixer. music. unpause() 继续 播放 
pygame. mixer. music. get_busy() 检测 声卡 是 否 正 被 占用 
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另外 , 跨 平台 音频 /视频 播放 支持 库 Phonon 也 提供 了 播放 音频 和 视频 文件 的 功能 ,或 
者 也 可 以 使 用 DirectSound 或 WMPlayer. ocx 或 其 他 控件 进行 音乐 文件 播放 。 本 节 主 要 以 
pygame 为 例 介绍 音乐 播放 器 的 编写 。 
下 面 的 代码 使 用 pygame. mixer 模块 编写 了 一 个 简单 的 音乐 播放 器 。 程 序 运行 后 ,将 
会 自动 随机 播放 指定 文件 夹 中 所 有 mp3 音乐 文件 ,并 自动 打印 显示 当前 正在 播放 的 音乐 文 
件 名 。 当 然 ,可 以 修改 这 段 代 码 以 支持 其 他 类 型 音乐 文件 的 播放 ,或 者 还 可 以 结合 第 9 E 
GUI 编程 的 知识 编写 一 个 更 加 漂亮 美观 的 音乐 播放 器 程序 。 


import os 
import pygame 
import random 
import time 


folder =r'h:\music' 


musics = [foldert '\\'+music for music in os.listdir(folder) if music.endswith ('.mp3')] 


total = len (musics) 


pygame.mixer.init() 


while True: 


if not pygame.mixer.music.get busy(): 


nextMusic = random.choice (musics) 


pygame.mixer.music.load (nextMusic) 


pygame.mixer.music.play (1) 


print 'playing'* ',nextMusic 


else: 


time.sleep(1) 


15.4 


语音 识别 


使 用 Python 编写 语音 识别 程序 需要 用 到 speech 模块 ,并 且 需 要 安装 pywin32 和 
Microsoft Speech SDK 。 
speech 模块 支持 的 主要 功能 有 : 文本 合成 语音 ,将 键盘 输入 的 文本 信息 以 语音 信号 方 


多 媒体 编程 


式 输出 ;语音 识别 ,将 输入 的 语音 信号 识别 为 文本 ;特定 词 的 识别 ,对 输入 的 语音 信号 进行 特 
定 词 的 捕捉 ;特定 用 户 、 特 定 词 的 识别 ,能够 对 不 同人 \ 不 同 特定 词 进行 识别 。 
speech 模块 的 主要 方法 如 表 15-4 所 示 。 


表 15-4 speech 模块 的 主要 方法 
方 法 说 明 
speech. say(phrase) 读 出 给 定 的 文本 


打印 信息 prompt 提示 用 户 使 用 语音 录入 在 phraselist 中 列 
出 的 文本 ,并 返回 用 户 录入 的 内 容 。 该 函数 会 阻塞 当前 线 
程 直至 得 到 用 户 录入 或 者 按 Ctrl 十 C 组 合 键 结束 

如 果 用 户 语音 录入 phraselist 中 的 任何 文本 , 则 自动 调用 回 
JRZ callback, 并 返回 Listener 对 象 


得 到 用 户 语 音 录 入 的 内 容 后 自动 执行 回调 函数 callback 
(spoken text. listener) ,并 返回 Listener 对 象 


speech. input(prompt= None, phraselist= 
None) 


speech. listenfor(phraselist, callback) 


speech. listenforanything(callback) 


speech. Listener. islistening(self) 当 Listener 对 象 处 于 监听 状态 时 返回 True 
speech. Listener. stoplistening(self) 停止 监听 , 当 Listener 对 象 处 于 监听 状态 时 返回 True 
speech. islistening() 只 要 有 Listener 对 象 正在 监听 则 返回 True 


停止 所 有 Listener 对 象 的 监听 状态 ,如 果 有 Listener 对 象 处 
于 监听 状态 则 返回 True 


speech. stoplistening() 


例如 ,下 面 的 代码 让 计算 机 读 出 用 户 输入 的 内 容 , 当 用 户 输 入 stop 时 结束 。 
>>>while True: 

words = input ("Please input some words:") 

if words.lower() == 'stop': 

break 

speech. say (words) 

下 面 的 代码 让 计算 机 接受 用 户 语音 输入 ,并 重复 一 遍 用 户 语音 录入 的 内 容 , 以 文字 形式 
显示 用 户 语音 输入 的 内 容 。 

>>> contents = speech.input () 


>>> speech.say (contents) 


>>>print contents 
本 章 知识 精 要 


(D Python 的 跨 平台 扩展 模块 PyOpenGL 封装 了 OpenGL API, 支 持 图 形 编程 所 需要 
的 所 有 功能 。 

(2) OpenGL 采用 的 是 “状态 机 ?工作 方式 ,一 旦 设置 了 某 种 状态 之 后 ,除非 显 式 修改 该 
状态 ,否则 该 状态 将 一 直 保 持 , 例 如 图 形 顶 点 的 颜色 .法 向 量 和 纹理 坐标 等 。 

(3) PIL 是 支持 Python 的 图 像 处 理 模块 ,提供 了 强大 的 图 像 处 理 功 能 。 

(4) 可 以 使 用 pygame. mixer、Phonon、DirectSound 或 WMPlayer. ocx 等 多 种 方式 进行 
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音乐 文件 播放 。 
(5) 使 用 Python 编写 语音 识别 程序 需要 用 到 speech 模块 ,并 且 需 要 安装 pywin32 模 
块 和 Microsoft Speech SDK。 


Hj 


l. 编程 程序 ,在 窗口 上 绘制 一 个 三 角形 ,设置 3 个 顶点 为 不 同 的 颜色 ,并 对 内 部 进行 光 
滑 着 色 。 

2. 编写 程序 , 读 取 两 幅 大 小 一 样 的 图 片 ,然后 将 两 幅 图 像 的 内 容 和 至 加 到 一 幅 图 像 ,结果 
图 像 中 每 个 像素 值 为 原来 两 幅 图 像 对 应 位 置 像素 值 的 平均 值 。 

3. 编写 程序 , 读 取 一 幅 图 像 的 内 容 ,将 其 按 象限 分 为 4 等 份 ,然后 1、3 象限 内 容 交换 ， 
2、4 象限 内 容 交 换 , 生 成 一 幅 新 图 像 。 

4. 结合 GUI 编程 知识 ,编写 一 个 程序 ,创建 一 个 窗口 并 在 上 面 放置 两 个 按钮 ,分 别 为 
“开始 播放 ”和 “暂停 播放 ”, 将 本 章 15. 3 节 中 的 音乐 播放 程序 进行 封装 。 

5. 运行 本 音 15.4 中 的 代码 并 查看 运行 结果 。 
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$165 “逆向 工程 与 软件 分 析 


对 于 大 多 数 程序 员 而 言 ,或 许 并 不 关心 关于 硬件 与 操作 系统 底层 或 者 软件 运行 机 制 的 
细节 ,只 需要 也 只 希望 把 更 多 的 精力 放 在 高 层 的 业务 逻辑 实现 上 面 。 但 是 毫 无 疑问 ,如 果 您 
对 底层 细节 了 解 或 熟悉 的 话 ,就 能 够 对 自己 开发 的 软件 进行 更 好 的 把 握 和 控制 。 对 硬件 和 
系统 底层 的 深刻 理解 有 利于 写 出 更 好 的 应 用 程序 ,对 于 程序 员 的 职业 发 展 也 是 非常 有 帮助 
的 。 而 在 某 些 领 域 ,逆向 工程 是 解决 问题 非常 重要 的 方式 ,甚至 可 能 是 唯一 的 方式 ,例如 软 
件 安全 测试 、 加 密 解 密 、 软 件 汉 化 、 漏 洞 挖掘 、 计 算 机 取证 、 恶 意 软件 分 析 和 版 权 保护 等 。 在 
这 些 领 域 中 ,一 般 很 难 获 得 软件 源 代码 ,只 能 对 二 进 制 可 执行 文件 进行 分 析 , 而 可 执行 文件 
由 于 编译 器 的 优化 一 般 变 得 非常 难以 理解 ,甚至 很 多 恶意 软件 根本 没有 可 独立 运行 的 文件 ， 
而 是 将 代码 注入 到 其 他 正常 进程 中 。 另 外 ,最 近 几 年 提出 的 ROP、JOP 攻击 甚至 没有 注入 
任何 代码 ,仅仅 通过 精心 选择 和 重新 组 合 进程 中 已 有 的 指令 序列 就 可 以 实现 自己 的 恶意 功 
能 。 所 有 这 些 都 给 安全 分 析 人 员 造 成 很 大 困难 和 挑战 ,这 要 求 分 析 人 员 对 道 向 工程 有 着 更 
全 面 而 准确 的 理解 和 把 握 , 并 且 能 够 熟练 运用 各 种 成 熟 的 工具 ,必要 的 时 候 甚至 需要 自己 编 
写 程序 来 完成 分 析 任 务 。 从 另 一 个 角度 来 讲 , 从 源 代码 级 别 对 软件 进行 分 析 ,无 法 获知 编译 
器 对 最 终 可 执行 文件 造成 的 影响 ,或 者 说 ,很 难保 证 编译 器 能 够 忠实 地 、 毫 无 错误 地 工作 。 
不 幸 的 是 ,编译 器 本 身 也 是 软件 的 一 种 ,同样 也 有 可 能 存在 漏洞 。 从 底层 对 最 终 可 执行 文件 
进行 分 析 , 可 以 综合 考虑 各 方面 的 因素 (包括 加 载 过 程 、. 进 程 管理 和 内 存 管理 等 ) ,虽然 难度 
相对 较 大 ,但 是 可 以 得 到 更 加 全 面 和 准确 的 信息 ,甚至 可 以 控制 和 修改 软件 的 运行 过 程 。 

在 本 章 中 ,重点 介绍 Windows 平台 上 PE 文件 的 分 析 。PE 的 全 称 是 Portable 
Executable, 指 可 移植 的 可 执行 文件 ,目前 的 最 新 版 本 是 2013 年 2 月 6 日 发 布 的 8.3 版 。 
PE 文件 包括 exe 文件 .com 文件 、dll 文件 ,ocx 文件 .sys 文件 、scr 文件 等 Windows 平台 上 
所 有 可 执行 文件 类 型 ,可 以 说 PE 文件 是 Windows 操作 系统 和 Windows 平台 上 所 有 软件 
和 程序 能 够 正常 运行 的 重要 基础 。 

需要 说 明 的 是 ,应 尽量 避免 直接 在 本 地 物理 主机 上 分 析 恶 意 软 件 ,以 免 被 恶意 软件 感染 
而 造成 不 必要 的 损失 。 为 了 保证 物理 主机 安全 ,同时 也 为 了 能 够 在 分 析 环 境 被 恶意 软件 感 
染 之 后 快速 恢复 系统 ,建议 您 使 用 VirtualBox, VMware, QEMU 等 虚拟 机 系统 或 沙 箱 系 统 
进行 保护 。 如 果 您 没有 条 件 使 用 虚拟 机 或 沙 箱 系统 ,也 请 使 用 Deep Freeze, Truman, FPG 
或 其 他 类 似 软 件 来 保护 物理 主机 以 防止 系统 被 感染 。 


16.1 主流 项 目 与 插件 简介 


在 软件 安全 和 逆向 工程 领域 ,有 大 量 的 成 熟 工具 以 及 针对 不 同 工 具 和 目的 开发 的 各 种 
插件 ,例如 IDA Pro, OllyDbg, WinDbg, W32DASM, PEid, ssdeep, DiStorm, DisView, 
LordPE,PIN,Universal PE Unpacker 和 Sample Chart Builder 等 ,可 以 说 是 数不胜数 。 本 
书 中 主要 介绍 使 用 Python 开发 或 可 以 使 用 Python 进行 二 次 开发 的 工具 和 插件 ,以 及 如 何 
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使 用 Python 开发 PE 文件 逆向 分 析 工 具 。 
16.1.1 主流 项 目 


目前 已 有 大 量 使 用 Python 作为 主要 语言 开发 的 软件 逆向 分 析 工 具 , 下 面 列 出 了 知名 
度 较 高 的 几 款 。 

(1) PyEmu: 可 编写 脚本 的 模拟 器 ,对 恶意 软件 分 析 非 常 有 用 。 

(2) Immunity Debugger: 著名 的 调试 器 ,是 在 OllyDbg 的 源 代 码 基 础 上 建立 起 来 的 ， 
外 观 与 OllyDbg 非常 相似 ,并 且 两 者 共享 很 多 的 底层 功能 和 控制 。Immunity Debugger 带 
有 内 置 的 Python 接口 和 专门 用 于 研究 漏洞 和 执行 恶意 软件 分 析 的 强大 API, 是 可 编写 脚本 
的 GUI 和 命令 行 软件 调试 器 ,支持 exploit 编写 二进制 可 执行 文件 道 向 工程 等 各 种 应 用 。 

(3) Paimei: 完全 使 用 Python 编写 ,是 非常 成 熟 的 逆向 工程 框架 ,包括 PyDBG,PIDA 
和 pGRAPH 等 多 个 可 扩展 模块 ,可 以 执行 大 量 静 态 分 析 和 动态 分 析 , 例 如 模糊 测试 ,代码 
覆盖 率 跟 踪 和 数据 流 跟踪 等 。 

(4) ropper: 比较 成 熟 的 ROP Gadgets 查找 与 可 执行 文件 分 析 工 具 , 其 反 汇 编 部 分 使 
用 了 成 熟 的 Capstone 框架 。 

(5) WinAppDbg: 纯 Python 调试 器 ,没有 本 机 代码 ,使 用 ctypes 封装 了 许多 与 调试 器 
有 关 的 Win32 API 调用 ,并 且 为 操作 线程 . 库 和 进程 提供 了 强 有 力 的 抽象 。 利 用 该 工具 可 
以 将 自己 编写 的 脚本 附加 为 调试 器 、 跟 踪 执行 ,拦截 API 调用 ,以 及 在 待 调试 进程 中 处 理事 
件 , 并 且 可 以 设置 各 种 断 点 。 

(6) YARA: 恶意 软件 识别 和 分 类 引擎 ,也 可 以 利用 YARA 创建 规则 以 检测 字符 串 、 入 
侵 序列 .正则 表达 式 和 字 节 模式 等 。 既 可 以 使 用 命令 行 模式 下 的 YARA 工具 扫描 文件 ,也 
可 以 利用 YARA 提供 的 API 函数 将 YARA 扫描 引擎 集成 到 C 或 Python 语言 编写 的 工 
Hm. 


16.1.2 常用 插件 


经 过 多 年 努力 ,不 同 的 研究 人 员 分 别 推出 了 用 于 不 同 软件 分 析 需 要 的 IDA, OllyDbg 以 
及 Immunity Debugger 插件 ,大 大 简化 了 分 析 人 员 的 工作 。 除 了 以 下 几 种 常用 插件 ,还 可 以 
通过 SDK 编写 自己 的 插件 ,或 者 通过 一 定 技术 将 OllyDbg 插件 转换 为 Immunity Debugger 
插件 ,大 大 提高 了 插件 的 应 用 范围 和 生命 力 。 

(D IDAPython 插件 : IDAPython 是 运行 于 交互 式 反 汇 编 器 IDA. 的 插件 ,用 于 实现 
IDA 的 Python 编程 接口 。IDA 在 逆向 工程 领域 具有 广泛 的 应 用 ,尤其 是 二 进 制 文件 静态 
分 析 , 其 强大 的 反 汇 编 功 能 一 直 在 业内 处 于 领先 水 平 。IDAPython 插件 使 得 Python 脚本 
程序 能 够 在 IDA 中 运行 并 实现 自 定义 的 软件 分 析 功 能 ,通过 该 插件 运行 的 Python 脚本 程 
序 可 以 访问 整个 IDA 数据 库 , 并 且 可 以 方便 地 调用 所 有 IDC 函数 和 使 用 所 有 已 安装 的 
Python 模块 中 的 功能 。 目 前 ,IDAPython 还 不 支持 Python 3, 较 高 版 本 的 IDA 中 集成 了 
IDAPython 插件 ,如 果 需 要 安装 或 升级 ,需要 登录 其 官方 网 站 下 载 安装 适合 您 当前 已 安装 
Python 和 IDA 版 本 的 IDAPython 插件 。 

(2) Hex-Rays Decompiler: IDA 插件 ,非常 成 熟 的 反 编 译 插件 。 

(3) PatchDiff2; IDA 插件 ,主要 用 于 补丁 对 比 。 
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(4) BinDiff: IDA 插件 ,主要 用 于 二 进 制 文件 差异 比较 。 

(5) hidedebug: Immunity Debugger 插件 ,可 以 隐藏 调试 器 的 存在 ,用 来 对 抗 某 些 通用 
的 反 调试 技术 。 

(6) IDAStealth: IDA 插件 ,可 隐藏 IDA Debugger 的 存在 ,用 来 对 抗 某 些 通用 的 反 调 


16.2 IDAPython 与 Immunity Debugger 编程 


16.2.1 IDAPython 编程 


安装 IDAPython 插件 时 ,一 定 要 正确 选择 适合 已 安装 的 Python 和 IDA 版 本 ,和 否则 可 
能 无 法 在 IDA 中 加 载 IDAPython 和 运行 您 编写 的 Python 程序 。 安 装 成 功 以 后 ,启动 IDA 
会 看 到 软件 界面 最 下 端 有 个 Python 标志 ,在 后 面 的 文本 框 中 可 以 直接 输入 并 运行 Python 
代码 ,如 图 16-1 所 示 。 另 外 ,使 用 IDLE 或 其 他 Python 开发 环境 或 者 记事 本 等 文本 编辑 器 
编写 Python 程序 后 ,在 IDA 主 界面 中 单 击 菜单 File, 然 后 选择 Script file, 在 弹出 的 “脚本 文 
件 选择 ”对话 框 中 ,可 以 看 到 文件 类 型 为 .ide 和 . py 两 种 ,如 图 16-2 所 示 。 也 就 是 说 ,现在 
可 以 在 IDA 中 运行 Python 程序 了 ,最 后 选择 并 运行 您 自己 编写 的 Python 程序 来 实现 自 定 
义 的 二 进 制 文件 分 析 任 务 。 


ext:01007503 

ext :010075A3 

ext :616075A3 

ext :01097503 __SEH_epilog 
security ini ext:01007503 

security chec ext:01007583 8B 4D FO 

report, gxfai 
sub 100T25F 
HtmlHelpA (x, > 
ClosePrinter 
GetPriaterbri 


ext: 61007506 64 89 0D 00 00 00 00 
ext:0100750D 59 
ext:0100758E SF 
ext:010075AF SE 
ext:010075B0 5B 
ext:01907581 C9 
582 51 
ext :61607583 C3 
ext :01007583 . SEH epilog 
(00006983 010075B3: SEH epilog+10 


+ pore se Y T 
The hotkeys are FS: decompile, Ctrl-FS: decompile all. 
Please check the Edit/Plugins menu for more informaton. 


AU: idle | Down Disk: SGB 


图 16-1 IDAPython 插件 安装 成 功 的 IDA 软件 界面 


接 下 来 ,主要 通过 几 个 示例 来 演示 如 何 使 用 Python 编程 并 在 IDA 中 运行 来 实现 PE XC 
件 分 析 。 详 细 的 IDC 库 函 数 可 以 查阅 官方 网 址 : 


251 


和 


=cript file name 


© Python27 


Qs: 


局 lits 

doe 

Ora 

Tools 

DvPython2. 8 Docs and Demos 
(O include 

ay 

(O capstone 3.0 

(C Ropper-1.4.0 


[A GoThr oughTheSegnents. py 
[P.ColorTheInstructions. py 
Collecting function chunks. p 
[PrIndegree and outdegree of fur 
[P queens. py 

[Pnunberlines. py 

[randon]. py 

P database, deno. py 

[A templates. py 
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[A somescript. py 
P Isfrinel. py 
[P tenp. py 

A figure test py 
(Scripts [Basvert_test py 


[a2 py [A pyemetest. py 


een n] inj 
文件 名 四: [so ] 
AES D: [+ ide * py Cra J| 


图 16-2 “脚本 文件 选择 ”对 话 框 


https://www.hex- rays.com/products/ida/support/idadoc/162.shtml 


https://www.hex- rays.com/products/ida/support/idapython docs/index.html 
CD 查看 PE 文件 中 所 有 段 的 名 字 ,起 始 地 址 以 及 结束 地 址 。 


for seg in Segments () : 
print SegName (seg), ' (*, hex (SegStart (seg) ) , ', ', hex (SegEnd (seg) ) , ') ' 


(2) 查看 PE 文件 中 所 有 段 的 名 字 与 长 度 。 


segments —dict () 
for seg ea in Segments () : 

segments [SegName (seg ea)] =SegEnd(seg_ea)- seg ea 
for seg name,seg data in segments.items(): 

print seg name,seg data 


(3) 查看 PE 文件 中 所 有 函数 信息 。 


for segment in Segments () : 
for function ea in Functions (SegStart (segment) , SegEnd (segment) ) : 
print hex(function ea),GetFunctionName (function ea) 


(4) 查找 PE 文件 中 指定 函数 调用 ,并 将 该 行 设置 为 红色 进行 高 亮 显 示 。 


from idaapi import * 
danger functions = ['strcpy', 'sprintf', 'strncpy', 'memcpy'] 
for func in danger functions: 
addr = LocByName (func) 
if addr !=BADADDR: 
cross refs =CodeRefsTo (addr, 0) 
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print 'Cross References to $s'$func 


for ref in cross refs: 
print 'S08x'Sref 
SetColor(ref,CIC ITEM, 0x0000££) 


C5) 遍历 函数 chunk, 


function chunks = [] 
for ea in Functions (): 
func iter -idaapi.func tail iterator t(idaapi.get func(ea)) 
status —func iter.main() 
while status: 
chunk =func iter.chunk() 
function chunks.append((chunk.startEA, chunk.endEA) ) 
status —func iter.next() 
for chunk in function chunks: 
print (hex (chunk [0]),hex (chunk [1])) , "belongs to function: ',GetFunctionName (chunk [0] ) 


(6) 统计 函数 入 度 与 出 度 。 


from sets import Set 

ea —ScreenEA () 

callers =dict() 

callees -dict() 

for function ea in Functions(SegStart(ea),SegEnd(ea)): # 遍历 当前 段 中 的 函数 


f name =GetFunctionName (function ea) AUR UA F 
callers[f name] —Set (map (GetFunctionName, CodeRefsTo (function ea,0))) 
# 调 用 该 函数 的 所 有 函数 


for ref ea in CodeRefsTo (function ea,0): # 遍 历 调用 该 函数 的 所 有 函数 
caller name =GetFunctionName (ref ea); 
callees[caller name] =callees.get (caller name,Set()) 
callees[caller name].add(f name) 
functions = Set (callees.keys () * callers.keys ()) 
for f in functions: 
print '$- 4d::%s::%4d'% (len (callers.get (f, []) ), £, 1en (callees.get (f, []))) 


(7) 统计 PE 文件 中 的 指令 频 度 。 


mnemonics =dict () 
ea =ScreenEA () 
for head in Heads (SegStart (ea), SegEnd (ea) ) : 
if isCode (GetFlags (head) ) : 
mnem = GetMnem (head) 
mnemonics [mnem] =mnemonics.get (mnem, 0)+1 


mnem list —map (lambda x: (x[1],x[0]), mnemonics.items ()) 
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mnem list.sort() 
for cnt, mnem in mnem list: 


print mnem, cnt 


针对 某 动 态 链接 库 文 件 ,上 面 的 代码 运行 结果 如 图 16-3 remem 

所 示 。 oes : 
(8) 查 找 潜在 的 ROP Gadgets. IPTA : 
ROP(Return-Oriented Programming) 4È Yt JL 4E Æ i íT [gl euet inden —S 

的 一 种 攻击 方式 。 在 早 些 年 ,黑客 通过 各 种 溢出 漏洞 和 保护 LES 

机 制 的 缺陷 来 实现 任意 代码 注入 和 执行 ,后 来 由 于 数据 执行 eee arr 

保护 (Data Execution Prevention, DEP) 和 地 址 空间 布局 随 em 

机 化 (Address Space Layout Randomization, ASLR) 等 保护 pus ibd 

技术 的 部 署 ,实现 代码 注入 攻击 的 难度 越 来 越 大 ,于 是 聪明 fene 1633 

的 黑客 又 发 明了 ROP 攻击 及 其 各 种 变种 ,其 主要 思想 是 通 reta 189 

过 精确 控制 进程 的 执行 流程 ,重新 组 合 和 复 用 可 执行 文件 中 m 2012, 

已 经 存在 的 代码 ,实现 恶意 目的 并 绕 过 特定 的 防护 技术 和 系 [now 11598 

统 。 目 前 针对 ROP 攻击 较为 有 效 的 防护 技术 有 不 定期 SS us 


ASLR 与 控制 流 完整 性 约束 (Control Flow Integrity. CFI) 
技术 。 粗 粒度 ASLR 已 经 被 确认 不 安全 ,而 细 粒 度 ASLR 
会 导致 代码 膨胀 从 而 增加 了 潜在 的 Gadgets ,并 且 很 可 能 会 使 得 库 函 数 无 法 共享 ,从 而 严重 
影响 了 细 粒 度 ASLR 的 实用 性 。 

ROP 攻击 首先 要 利用 特定 漏洞 来 实现 栈 上 内 容 的 覆盖 ,通过 覆盖 栈 上 的 函数 返回 地 址 
来 实现 控制 流 的 修改 ,重新 组 合 已 有 的 代码 并 构造 Gadgets 链 来 实现 恶意 目的 。ROP 
Gadgets 是 指 较 短 的 汇编 指令 序列 ,一般 以 ret 指令 或 其 他 间接 跳 转 指令 (例如 jmp eax 或 
call eax 45) Z5 38 ,每 个 Gadget 仅仅 实现 功能 非常 有 限 的 运算 ,但 大 量 的 Gadgets 链接 起 来 
却 可 以 实现 任意 功能 。ROP 已 被 证 明 是 图 灵 完 备 的 。 

下 面 的 代码 演示 了 在 PE 可 执行 文件 中 搜索 ROP Gadgets 的 基本 原理 。 这 只 是 个 基本 
的 演示 ,并 没有 考虑 更 加 复杂 的 情况 。 例 如 ,如 果 控 制 流 能 够 跳 转 到 指令 中 间 开 始 执 行 , 就 
会 打 乱 原 有 的 指令 序列 而 产生 新 的 指令 ,从 而 产生 原本 不 存在 的 Gadget, 这 种 情况 这 里 没 
有 考虑 。 您 可 以 根据 需要 对 下 面 的 代码 进行 修改 ,或 者 阅读 ropper 工具 的 源 代码 以 了 解 更 
多 知识 。 


图 16-3 指令 频 度 统计 结果 


import time 

import re 

instructions = [] 

controlInstructions = ('call','ret', 'retn', 'jmp', "jz 'je', ' jnz', 'jne', 
'js', "jns! , 'jo', 'jno', 'jp', 'jpe', 'jnp', 'jpo', 'jc', 
'jb', 'jnae', 'jbe', 'jna', 'jnc', 'jnb', 'jae', 'jnbe', 
'ja', 'jl', 'jnge', 'jnl', 'jge', 'jle', 'jng', 'jnle', 
'jg', 'jcxz', 'jecxz') 


def ReadInstructions () : 
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for seg ea in Segments () : 
for head in Heads (seg ea,SegEnd(seg ea)): 
if isCode (GetFlags (head) ) : 
#here using GetMnem(head) can get only mnemonic 
instruction =GetDisasm (head) 


instructions.append ( (hex (head) , instruction) ) 


#print all the direct or indirect control instructions 
print 'The number of all instructions found is:',len(instructions) 
print 'And the direct or indirect control instructions are:' 


allControlInstructionsCount =0 # the number of control instructions 


#get all the mnemonics from instructions 


mnemonics = [t[1].split() [0] for t in instructions] 


for ins in controlInstructions: 
if ins in mnemonics: 
print ins,mnemonics.count (ins) 
allControlInstructionsCount =allControlInstructionsCount+ mnemonics .count (ins) 
print 'The number of all control instructions is:',allControlInstructionsCount 


# check if given instruction is a indirect control diversion instruction 
def Check (instruction): 
if instruction.startswith('ret') or instruction.startswith('retn'): 
return True 
else: 
for instr in controlInstructions: 
if instr in ('ret', 'retn'): 
continue 
if instruction.startswith (instr + ' e'):flike call edi 
return True 


return False 


# output the potential gadgets 
def Output (start, end): 

print '-'* 30 

for i in range(start, end+1): 


print instructions[i] 


# £ind potential gadgets 

def FindGadgets () : 
total = len (instructions) 
gadgetNumber =0 
index =total -1 
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while index >=0: 
instruction =instructions [index] 
if Check (instruction[1]): 
gadgetNumber +=1 
for i in range(1, 20): 
if Check (instructions [index -i][1]): 
Output (index -i +1, index) 
index = index -i 
break 
else: 
Output (index - 19, index) 
index -=19 
else: 
index -=1 
print '='* 30 
print 'Total number of gadgets:', gadgetNumber 


start =time.time() 
ReadInstructions () 
FindGadgets () 


print time.time() -start 


16.2.2 Immunity Debugger 编程 


Immunity Debugger 是 一 款 使 用 Python 开发 的 ,非常 成 熟 的 调试 器 软件 ,支持 软件 调 
试 的 几乎 所 有 功能 ,可 以 用 于 实现 漏洞 利用 编写 、 模 糊 测 试 、 恶 意 软 件 分 析 以 及 可 执行 文件 
的 逆向 工程 分 析 , 并 且 支 持 PyCommand 接口 以 支持 Python 编程 进行 二 次 开发 ,其 启动 界 
面 如 图 16-4 所 示 。 

在 Immunity Debugger 界面 中 的 工具 栏 上 单 击 左边 第 二 个 带 有 符号 二 二 二 的 工具 按 
钮 ,打开 Immunity Debugger Python Shell 窗口 ,在 该 窗口 中 可 以 直接 执行 Python 语句 ,并 
通过 对 象 imm 来 访问 Immlib 库 的 所 有 成 员 , 如 图 16-5 所 示 。 或 者 ,可 以 通过 在 Immunity 
Debugger 主 界面 下 面 的 命令 框 中 输入 “1” 符 号 来 执行 编写 好 的 Python 程序 完成 分 析 任 务 ， 
如 图 16-6 所 示 。 

编写 自己 的 插件 时 ,可 以 使 用 IDLE 或 记事 本 等 任意 文本 编辑 器 编写 Python 源 程序 ， 
然后 将 程序 文件 存放 至 Immunity Debugger 安装 目录 下 的 PyCommands 目录 中 ,最 后 通过 
在 Immunity Debugger 主 界面 下 方 命令 框 中 输入 “!” 后 加 上 程序 文件 名 称 即 可 执行 ,如 
图 16-6 所 示 。 下 面 再 通过 几 个 示例 来 演示 如 何 利 用 Python 编程 实现 PE 文件 分 析 , 您 也 
可 以 参考 Immunity Debugger 安装 目录 下 的 PyCommands 目录 中 的 文件 来 了 解 更 多 分 析 
技巧 ,或 者 根据 自己 的 软件 分 析 需 求 来 编写 相应 的 插件 。 
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OU lemtwhcbkbz:.s?NETETEZITSITETTTIUTI 


Ifindloop 01007303 


Vist Datammande 


CHF pu 


Pus 


POP 


H notepad. 8100 
DWORD PTR Ds 


图 16-4 Immunity Debugger 启动 界面 


ux eS lemtwhcPkbzr. 


B *** Immunity Debugger Python Shell v0.1 *** 

Immlib instantiated as 'imm' PyObject 

|READY. 

>>>imm.openProcessf"c:\windows\\notepad.exe"} 

0 

>>>regs = imm.getRegs() 

»»»print regs 

('EIP': 16806813L, "ESP": 5242281, 'EDI': 6881390L, 'EAX': OL 
»»»regs['EIP'] 

16806813L 


图 16-5 在 Immunity Debugger 中 执行 Python 语句 
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[isearch RET 
[Search conpletedt 


图 16-6 在 Immunity Debugger 中 执行 Python 程序 


1. 寻找 可 执行 文件 中 的 循环 


from immlib import * 
from immutils import * 


import getopt 


DESC- """ Find natural loops given a function start address """ 


def usage (imm) : 


imm.log("!findloop -a <address>") 


a (function start address) ") 


imm.log("-h This help") 


def main (args): 
imm = Debugger () 
try: 
opts, argo -getopt.getopt (args, "a:") 
except: 
return usage (imm) 
for o,a in opts: 


ifo--"- 


loops —imm.findLoops (int (a, 16) ) 


得 与 软件 分 析 


for loop in loops: 
imm.log("LOOP! from:0x%08x, to:0x%08x"% (loop[0], loop[1]), loop[0]) 


func = imm.getFunction (int (a, 16) ) 
bbs = func.getBasicBlocks () 


# 寻 找 第 一 个 和 最 后 一 个 节点 
first —Oxffffffff 
last =0 
for node in loop[2]: 
if node « first: first =node 
if node > last: last =node 


# 标 记 循环 节点 ,但 如 果 存 在 任何 形式 的 注释 就 不 做 任何 改变 
for node in loop[2]: 
imm.log(" Loop node:0x$08x"$node, node) 
for bb in bbs: 
if bb.getStart() ==node: 
instrs —bb.getInstructions (imm) 
for op in instrs: 


if not imm.getComment (op.getAddress ()) and op.getAddress 


() !» node: 
if node == last and op.getAddress () == instrs [- 1]. 
getAddress () : 


# 最 后 一 个 节点 的 最 后 一 个 指令 
imm.setComment (op.getAddress (), "/") 
else: 


imm.setComment (op.getAddress () "|") 


if not imm.getComment (node) : 
if node -- first: 
imm.setComment (node, "X Loop 0x%08X Node"% (1oop[0]) ) 
else: 


imm.setComment (node, "| Loop 0x%08X Node"$ (1oop[0]) ) 


return "Done!" 
ifo--"-h": 


return usage (imm) 


2. 寻找 可 执行 文件 中 的 打包 器 
import immlib 
import getopt 
import struct 


DESC ="""Find a Packer/Cryptor on a Module (Note: It might take some times due to the amount of 
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signature on our db)""" 


def usage (imm) : 
imm.log("!findpacker [-f] —m filename/module Get the RPC information of a loaded dll or 
for all loaded DLL's",focus-1) 
imm.log(" —m filename/module File or Module to search for") 
imm.log(" - f When set, it look in the file instead of the loaded module") 
imm.log(" ex: !findpacker -m notepad") 
imm.log("NOTE: It might take same times due to the amount of signature on our db") 


def main(args): 
imm = iml ib. Debugger () 
if not args: 
usage (imm) 
return "No args" 
try: 
opts, argo =getopt.getopt (args, "m:f") 
except getopt.GetoptError: 
usage (imm) 


return "Bad heap argument %s" $args[0] 


module =None 


OnMemory =1 


for o,a in opts: 


if o=="- g": 
module =a 
elifo--'-f': 


OnMemory =0 


if not module: 
usage (imm) 


return "No module provided, see the Log Window for details of usage" 


try: 
ret —imm.findPacker ( module, OnMemory =OnMemory) 
except Exception, msg: 


return "Error: %s" $msg 


if not ret: 


return "No Packer found" 


for (addr, name) in ret: 
imm.log("Packer found!: ss at 0x%08x" % (name, addr), address —addr) 
return "Packers found on $s: $d" $ (module, len(ret)) 
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3. 寻找 可 执行 文件 中 的 指令 


import immlib 
DESC ="Search code in memory" 


def usage (imm) : 
imm.log("!searchcode Search code in memory") 
imm. log ("!searchcode < asm code» ") 


def main(args): 
imm = iml ib. Debugger () 


look =" ".join(args) 


ret =imm.search( imm.assemble( look ) ) 
fora in ret: 


module = imm. findModule (a) 
if not module: 

module = "none" 
else: 


module =module [0] 


#Grab the memory access type for this address 
page = imm.getMemoryPageByAddress ( a ) 


access =page.getAccess ( human = True ) 


imm. log ("Found $s at 0x%08x [%s] Access: ($s)" $(look, a, module, access), address = 
a) 

if ret: 
return "Found $d address (Check the Log Window for details)" %len (ret) 

else: 


return "Sorry, no code found" 


16.3 Windows 平台 软件 调试 原理 


不 论 使 用 什么 语言 开发 软件 调试 器 ,其 基本 原理 都 是 一 致 的 ,都 是 调用 操作 系统 自身 提 
供 的 调试 接口 ,设置 断 点 ,并 对 被 调试 软件 的 执行 过 程 以 及 有 关 事件 进行 跟踪 和 处 理 。 在 本 
节 中 ,主要 介绍 Windows 平台 上 的 调试 接口 .调试 事件 和 断 点 等 基本 概念 与 调试 原理 。 


16.3.1 Windows 调试 接口 


在 Win32 中 自 带 了 大 量 支 持 不 同类 型 应 用 开发 的 APT 函数 ,其 中 一 部 分 被 称 为 Win32 调 
试 APICWin32 Debug APD ,提供 了 编写 软件 调试 器 所 需要 的 大 部 分 功能 。 利 用 这 些 API 可 以 
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加 载 一 个 程序 或 将 调试 器 捆绑 到 一 个 正在 运行 的 进程 上 以 供 调试 ;可 以 获得 被 调试 进程 的 深 
层 信息 ,例如 进程 人 D、 入 口 地 址 和 映像 基 址 等 ;甚至 可 以 对 被 调试 的 程序 进行 任意 的 修改 , 包 
括 进程 的 内 存 和 线程 的 运行 环境 等 。 表 16-1 列 出 了 常用 的 Windows 调试 API。 


表 16-1 常用 的 Windows 调试 API 


API 函数 功能 说 明 
ContinueDebugEvent() 恢复 先前 由 于 调试 事件 而 挂 起 的 线程 
DebugActiveProcess() 将 调试 器 捆绑 到 一 个 正在 运行 的 进程 上 
DebugActiveProcessStop() | 将 调试 器 从 一 个 正在 运行 的 进程 上 印 载 
在 当前 进程 中 产生 一 个 断 点 异常 ,如 果 当 前 进程 不 是 处 在 被 调试 状态 , 那 
DebugBreak() 么 这 个 异常 将 被 系统 例 程 接管 ,多 数 情况 下 会 导致 当前 进程 被 终止 。 与 
在 程序 中 直接 插入 INT 3 的 效果 一 样 
DebugBreakProcess() 在 指定 进程 中 产生 一 个 断 点 异常 
EE 将 使 调用 进程 强制 退出 ,将 控制 权 转移 至 调试 器 ,在 退出 前 会 先 调用 一 个 
INT 3 断 点 
FlushInstructionCache() 刷新 指令 高 速 缓存 
GetThreadContext() 获取 指定 线程 的 执行 环境 
GetThreadSelectorEntry() ”| 返回 指定 选择 器 和 线程 的 描述 符 表 的 和 人口 地 址 
IsDebuggerPresent() 判断 调用 进程 是 否 处 于 被 调试 环境 中 
OutputDebugString() 将 一 个 字符 串 传递 给 调试 器 显示 
ReadProcessMemory() 读 取 指 定 进程 的 某 区 域内 的 数据 
SetThreadContext() 设置 指定 线程 的 执行 环境 
WaitForDebugEvent() 等 待 被 调试 进程 发 生 调 试 事件 
WriteProcessMemory() 在 指定 进程 的 某 区 域内 写 和 数据 
16.3.2 调试 事件 


调试 器 的 主要 工作 是 监视 目标 进程 的 执行 并 对 目标 进程 执行 过 程 中 发 生 的 每 一 个 调试 
事件 进行 相应 的 响应 和 处 理 。 当 目标 进程 发 生 一 个 调试 事件 后 ,系统 将 会 通知 调试 器 来 处 
理 这 个 事件 ,调试 器 利用 WaitForDebugEvent O 函数 来 获取 目标 进程 中 发 生 的 调试 事件 信 
息 。 常 用 的 调试 事件 如 表 16-2 所 示 。 


表 16-2 调试 事件 


调试 事件 * X 

进程 被 创建 。 当 调试 的 进程 刚 被 创建 (还 未 运行 ) 或 调试 器 开 
始 调试 已 经 激活 的 进程 时 ,就 会 生成 这 个 事件 

在 调试 进程 中 创建 一 个 新 的 进程 或 调试 器 开始 调试 已 经 激活 


CREATE THEAD DEBUG EVENT | 的 进程 时 ,就 会 生成 这 个 调试 事件 。 要 注意 的 是 , 当 调 试 的 主 
线程 被 创建 时 不 会 收 到 该 通知 


CREATE_PROCESS_DEBUG_EVENT 
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续 表 


调试 事件 


EXCEPTION_DEBUG_EVENT 在 调试 的 进程 中 出 现 了 异常 ,就 会 生成 该 调试 事件 


EXIT PROCESS DEBUG EVENT 每 当 退 出 调试 进程 中 的 最 后 一 个 线程 时 ,产生 这 个 事件 


EXIT_THREAD_DEBUG_EVENT 
x S a 到 该 通知 


调试 中 的 线程 退出 时 事件 发 生 , 调 试 的 主线 程 退出 时 不 会 收 


LOAD_DLL_DEBUG_EVENT 


每 当 被 调试 的 进程 装载 DLL 文件 时 ,就 生成 这 个 事件 。 当 
PE 装载 器 第 一 次 解析 出 与 DLL 文件 有 关 的 链接 时 ,将 收 到 
这 一 事件 。 调 试 进程 使 用 了 LoadLibrary 时 也 会 发 生 。 每 当 
DLL 文件 装载 到 地 址 空间 中 去 时 ,都 要 调用 该 调试 事件 


OUTPUT_DEBUG_STRING_EVENT 符 串 时 该 事件 发 生 


当 调试 进程 调用 DebugOutputString 函数 向 程序 发 送 消息 字 


UNLOAD DLL DEBUG EVENT 
为 0 时 ) 


每 当 调试 进程 使 用 FreeLibrary 函数 印 载 DLL 文件 时 ,就 会 生 
成 该 调试 事件 。 仅 当 最 后 一 次 从 过 程 的 地 址 空间 印 载 DLL 
文件 时 , 才 出 现 该 调试 事件 (也 就 是 说 DLL 文件 的 使 用 次 数 


RIP_EVENT 


只 有 Windows 98 检查 过 的 构件 才 会 生成 该 调试 事件 。 该 调 
试 事件 是 报告 错误 信息 


当 WaitForDebugEvent C) 接收 到 一 个 调试 事件 时 ,会 把 调试 事件 的 信息 填写 人 
DEBUG EVENT 结构 中 返回 ,然后 检查 dwDebugEventCode 字段 中 的 值 ,根据 它 来 判断 被 
调试 的 进程 中 发 生 了 哪 种 类 型 的 调试 事件 。 在 调试 事件 结构 体 中 ,dwProcessId 的 值 是 调 
试 事件 所 发 生 的 进程 的 标识 符 ,dwThreadId 的 值 是 调试 事件 所 发 生 的 线程 的 标识 符 , 最 后 


一 个 是 与 调试 事件 类 型 dwDebugEventCode 对 应 的 共用 体 成 员 。 


typedef struct DEBUG EVENT { 
DWORD dwDebugEventCode; 
DWORD dwProcessId; 
DWORD dwThreadId; 
union { 
EXCEPTION DEBUG INFO Exception; 
CREATE THREAD DEBUG INFO CreateThread; 


CREATE PROCESS DEBUG INFO CreateProcessInfo; 


EXIT THREAD DEBUG INFO ExitThread; 
EXIT PROCESS DEBUG INFO ExitProcess; 
LOAD DLL DEBUG INFO LoadDll; 
UNLOAD DLL DEBUG INFO UnloadDll; 
OUTPUT DEBUG STRING INFO DebugString; 
RIP INFO RipInfo; 

} u; 


) DEBUG EVENT; 


16.3.3 进程 调试 


实际 应 用 时 ,根据 不 同 的 需要 ,可 以 创建 一 个 新 的 进程 进行 调试 ,也 可 以 调试 一 个 正在 
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运行 的 进程 ,不 管 哪 种 方式 ,都 需要 建立 循环 不 断 地 接收 和 处 理 调 试 事 件 ,进行 相应 的 处 理 ， 
然后 等 待 下 一 个 调试 事件 的 触发 。 
1. 创建 一 个 新 进程 以 供 调试 
通过 CreateProcess ( ) 创 建新 进程 时 , 如果 在 dwCreationFlags 标志 字段 中 设置 了 
DEBUG_PROCESS 或 DEBUG_ONLY_THIS_PROCESS 标志 ,将 创建 一 个 用 以 调试 的 新 
进程 。 
2. 调试 一 个 已 有 进程 
利用 DebugActiveProcess() 函 数 可 以 将 调试 器 捆绑 到 一 个 正在 运行 的 进程 上 ,如 果 执 
行 成 功 , 则 效果 类 似 于 利用 DEBUG_ONLY_THIS_PROCESS 标志 创建 的 新 进程 。 要 注意 
的 是 ,在 NT 内 核 下 当 试 图 通过 DebugActiveProcess() 函 数 将 调试 器 捆绑 到 一 个 创建 时 带 
有 安全 描述 符 的 进程 上 时 ,将 被 拒绝 。 
3. 建立 事件 监视 循环 
使 用 WaitForDebugEvent() 和 ContinueDebugEvent O 函数 建立 循环 来 不 断 地 监视 调 
试 事件 。WaitForDebugEvent() 在 一 段 时 间 内 等 待 目标 进程 中 调试 事件 的 发 生 , 如 果 在 这 
段 时 间 没 有 调试 事件 发 生 ,那么 函数 将 返回 False; 如 果 在 指定 时 间 内 调试 事件 发 生 了 ,那么 
函数 将 返回 True, 并 且 把 所 发 生 的 调试 事件 及 其 相关 信息 填写 入 一 个 DEBUG_EVENT 结 
构 。 然 后 调试 器 会 检查 这 些 信 息 ,并 据 此 进行 相应 的 处 理 。 在 对 这 些 事件 进行 相应 的 操作 
后 ,就 可 以 使 用 ContinueDebugEvent() 函 数 来 恢复 线程 的 执行 ,并 等 待 下 一 个 调试 事件 的 
发 生 。 需 要 注意 的 是 ,WaitForDebugEvent() 只 能 使 用 在 创建 以 供 调试 的 或 是 已 被 拥 绑 调 
试 器 的 进程 中 的 某 个 线程 上 。 下 面 的 代码 以 C 语言 形式 演示 了 该 循环 的 构建 方式 。 
PROCESS INFORMATION pi; 
STARTUP INFO si; 
DEBUG EVENT devent; 
if (CreateProcess (0, "target .exe", 0, 0, FALSE, DEBUG ONLY THIS PROCESS, 0,0, &si,pi)) 
1 
while (TRUE) 
t 
if(WaitForDebugEvent(&devent,100)) — //fE 100ms 内 等 待 调试 事件 
t 
switch (devent.dwDebugEventCode) 
[i 
case CREATE PROCESS DEBUG EVENT: 
// 在 此 处 编写 自己 的 处 理 代码 
break; 
case EXIT PROCESS DEBUG EVENT: 
// 在 此 处 编写 自己 的 处 理 代码 
break; 
case EXCEPTION DEBUG EVENT: 
// 在 此 处 编写 自己 的 处 理 代 码 
break; 


// 其 他 类 型 调试 事件 处 理 代码 
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ContinueDebugEvent (devent.dwProcessId, devent.dwThreadId,DBG CONTINUE); 
$ 
else 
t 
// 其 他 一 些 操作 


MessageBox (0, "Unexpected load error","Fatal Error" ,MB OK); 
} 


16.3.4 线程 环境 


每 个 进程 都 有 一 个 最 初 的 主线 程 ,通过 主线 程 可 以 创建 在 同一 地 址 空间 中 运行 的 其 他 
线程 。 进 程 并 不 执行 代码 ,真正 执行 代码 的 是 线程 。 同 一 个 进程 中 的 所 有 线程 共享 相同 的 
地 址 空间 和 相同 的 系统 资源 ,但 是 每 个 线程 又 有 不 同 的 执行 环境 。 

Windows 分 配给 每 个 线程 一 个 很 短 的 时 间 片 .时间 片 用 完 之 后 ,系统 将 暂停 当前 线程 
并 切换 到 下 一 个 具有 最 高 优先 级 的 待 调度 线程 。 在 切换 之 前 ,系统 会 把 当前 线程 执行 状态 
保存 到 一 个 名 为 CONTEXT 的 结构 体 中 ,包括 线程 执行 所 用 寄存 器 、 系 统 堆 栈 和 用 户 堆栈 、 
线程 所 用 的 描述 符 表 等 其 他 状态 信息 。 当 该 线程 再 次 被 调度 进入 CPU 运行 时 ,系统 将 恢 
复 上 次 保存 的 上 下 文 ,以便 线 程 可 以 继续 上 一 次 未 完成 的 工作 。 

在 调试 时 ,为 了 满足 某 些 特定 调试 目的 ,也 可 以 根据 需要 来 读 取 和 修改 线程 环境 ,具体 
步骤 有 4 个 。 

(1) 调用 SuspendThread O 函数 暂停 线程 。 

(2) 调用 GetThreadContext() 函 数 读 取 线 程 环境 。 

G) 修改 读 取 到 的 数据 ,再 调用 SetThreadContext() 函 数 设 置 线程 新 的 执行 环境 。 

(4) 调用 ResumeThread O 函数 恢复 线程 执行 。 


16.3.5 BA 


断 点 是 最 常用 的 软件 调试 技术 之 一 ,其 基本 思想 是 在 某 一 个 位 置 设 置 一 个 “陷阱 ”, 当 
CPU 执行 到 这 个 位 置 时 停止 被 调试 的 程序 并 中 断 到 调试 器 中 ,让 调试 者 进行 分 析 和 调试 ， 
调试 者 分 析 结 束 后 ,可 以 让 被 调试 程序 恢复 执行 。 通 过 设置 断 点 可 以 暂停 程序 执行 ,并 可 以 
观察 和 记录 指令 信息 、 变 量 值 堆栈 参数 和 内 存 数据 ,还 可 以 深入 了 解 和 把 握 程序 执行 的 内 
部 原理 和 详细 过 程 , 断 点 对 于 软件 调试 具有 重要 的 意义 和 作用 。 

断 点 可 以 分 为 软件 断 点 \ 硬 件 断 点 和 内 存 断 点 三 大 类 ,也 有 的 分 为 代码 断 点 、 数 据 断 点 
All 1/O 断 点 三 类 ,这 里 只 介绍 前 一 种 分 类 标准 。 

1. 软件 断 点 

软件 断 点 是 一 个 单字 节 指 令 (INT 3 , 字 节 码 为 0xCC) ,可 以 在 程序 中 设置 多 个 软件 断 
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点 ,使 得 程序 执行 到 该 处 时 能 够 暂停 执行 ,并 将 控制 权 转 移 给 调试 器 的 断 点 处 理 函 数 。 

当 调 试 器 被 告知 在 目标 地 址 设置 一 个 断 点 , 它 首先 读 取 目标 地 址 的 第 一 个 字 节 的 操作 
码 , 然 后 保存 起 来 ,同时 把 地 址 存储 在 内 部 的 中 断 列表 中 。 接 着 ,调试 器 把 一 个 字 节 操作 码 
0xCC 写 人 刚才 的 地 址 。 当 CPU 执行 到 0xCC 操作 码 时 就 会 触发 一 个 INT 3 中 断 事件 ,此 
时 调试 器 就 能 捕捉 到 这 个 事件 。 调 试 器 继续 判断 这 个 发 生 中 断 事件 的 地 址 (通过 指令 指针 
寄存 器 EIP) 是 不 是 自己 先前 设置 断 点 的 地 址 。 如 果 在 调试 器 内 部 的 断 点 列表 中 找到 了 这 
个 地 址 ,就 将 设置 断 点 前 存储 起 来 的 操作 码 写 回 到 目标 地 址 ,这 样 进程 被 调试 器 恢复 后 就 能 
正常 执行 。 

2. 硬件 断 点 

硬件 断 点 通过 调试 寄存 器 实现 ,设置 在 CPU 级 别 上 , 当 需 要 调试 某 个 指定 区 域 而 又 无 
法 修改 该 区 域 时 ,硬件 断 点 非常 有 用 。 

一 个 CPU 一 般 会 有 8 个 调试 寄存 器 (DR0 一 DR7) ,用 于 管理 硬件 断 点 。 其 中 调试 寄存 
器 DRO 到 调试 寄存 器 DR3 存储 硬件 断 点 地 址 ,同一 时 间 内 最 多 只 能 设置 4 个 硬件 断 点 ; 
DR4 和 DR5 保留 ,DR6 是 状态 寄存 器 ,说 明 被 断 点 触发 的 调试 事件 的 类 型 ;DR7 本 质 上 是 
一 个 硬件 断 点 的 开关 寄存 器 ,同时 也 存储 了 断 点 的 不 同类 型 。 通 过 在 DR7 寄存 器 里 设置 不 
同 标志 ,能 够 创建 以 下 几 种 断 点 : 当 特定 的 地 址 上 有 指令 执行 时 中 断 、 当 特定 的 地 址 上 有 数 
据 写 入 时 、 当 特定 的 地 址 上 有 数据 读 或 者 写 但 不 执行 时 。 

硬件 断 点 使 用 INT 1 实现 ,该 中 断 负责 硬件 中 断 和 步 进 事件 。 步 进 是 指 根据 预定 的 流 
程 一 条 一 条 地 执行 指令 ,每 执行 完 一 条 指令 后 暂停 下 来 ,从 而 可 以 精确 地 观察 关键 代码 并 监 
视 寄存 器 和 内 存 数据 的 变化 。 在 CPU 每 次 执行 代码 之 前 ,都 会 先 确认 当前 将 要 执行 代码 
的 地 址 是 否 是 硬件 断 点 的 地 址 ,同时 也 要 确认 是 否 有 代码 要 访问 被 设置 了 硬件 断 点 的 内 存 
区 域 。 如 果 任 何 储存 在 DRO~ DR3 中 的 地 址 所 指向 的 区 域 被 访问 了 ,就 会 触发 INT 1 中 
断 , 同 时 暂停 CPU; 如 果 不 是 中 断 地 址 则 CPU 执行 该 行 代码 ,到 下 一 行 代 码 时 ,CPU 继续 
重复 上 面 的 过 程 。 

3. 内 存 断 点 

内 存 断 点 是 通过 修改 内 存 中 指定 块 或 页 的 访问 权限 来 实现 的 。 通 过 将 指定 内 存 块 或 页 
的 访问 权限 属性 设置 为 受 保护 的 , 则 任何 不 符合 访问 权限 约束 的 操作 都 将 失败 ,并 抛 出 异 
常 ,导致 CPU 暂停 执行 ,使 得 调试 器 可 以 查看 当前 执行 状态 。 

一 般 来 说 ,每 个 内 存 块 或 页 的 访问 权限 都 由 3 种 不 同 的 访问 权限 组 成 : 是 否 可 执行 .是 
否 可 读 、 是 否 可 写 。 每 个 操作 系统 都 提供 了 用 来 查询 和 修改 内 存 页 访问 权限 的 函数 ,在 
Windows 操作 系统 中 可 以 使 用 VirtualProtect O 函数 来 修改 主 调 进程 虚拟 地 址 空间 中 已 提 
交 页 面 的 保护 属性 ,使 用 VirtualProtectEx() 函 数 可 以 修改 其 他 进程 虚拟 地 址 空间 页 面 的 
保护 属性 。 


16.4 案例 精 选 


本 节 中 通过 一 些 示 例 来 演示 如 何 使 用 Python 编写 程序 分 析 PE 文件 ,其 中 用 到 了 不 同 
的 扩展 库 ,请 根据 需要 进行 下 载 安装 。 
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1. 利用 pefile 模块 查看 PE 文件 详细 信息 


>>> import pefile 
>>> f —pefile.PE (r'C: Windows Wnotepad.exe') 
>>>f 

<pefile.PE instance at 0x0164CB98> 
>>>print f 


输出 结果 (上 略 ) 


>>>print f.FILE HEADER 
[IMAGE FILE HEADER] 

OxE4 0x0 Machine: 

OxE6 0x2 NumberOfSections: 

OxE8 0x4 TimeDateStamp: 

OxEC 0x8 PointerToSymbolTable: 
OxFO OxC NumberOfSymbols: 

OxF4 0x10 SizeOfOptionalHeader: 
OxF6 0x12 Characteristics: 
>>>print f.OPTIONAL HEADER 

[IMAGE OPTIONAL HEADER] 

OxF8 0x0 Magic: 

OxFA 0x2 MajorLinkerVersion: 
OxFB 0x3 MinorLinkerVersion: 
OxFC 0x4 SizeOfCode: 

0x100 0x8 SizeOfInitializedData: 
0x104 OxC SizeOfUninitializedData: 
0x108 0x10 AddressOfEntryPoint: 
Oxl0C 0x14 BaseOfCode: 

0x110 0x18 BaseOfData: 

0x114 0x1C ImageBase: 

0x118 0x20 SectionAlignment: 
OxllC 0x24 FileAlignment: 

0x120 0x28 MajorOperatingSystemVersion: 
0x122 0x2A MinorOperatingSystemVersion: 
0x124  Ox2C MajorImageVersion: 
0x126 Ox2E MinorImageVersion: 
0x128 0x30 MajorSubsystemVersion: 
0x12A 0x32 MinorSubsystemVersion: 
0x12C 0x34 Reservedl: 

0x130 0x38 SizeOflmage: 

0x134 Ox3C SizeOfHeaders: 

0x138 0x40 CheckSum: 

Ox13C 0x44 Subsystem: 

Ox13E 0x46 DllCharacteristics: 
0x140 0x48 SizeOfStackReserve: 


Oxl4C 

0x3 

0x48025287 [Sun Apr 13 18:35:51 2008 UTC] 
0x0 


0x7800 
0x8800 
0x0 
0x739D 
0x1000 
0x9000 
0x1000000 
0x1000 
0x200 
0x5 
0x1 
0x5 


0x12F20 
0x400 
0x18ADA 
0x2 
0x8000 
0x40000 


软件 分 析 
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0x144 0x4C SizeOfStackCommit: 0x11000 
0x148 0x50 SizeOfHeapReserve: 0x100000 
Ox14C 0x54 SizeOfHeapCommit: 0x1000 
0x150 0x58 LoaderFlags: 0x0 
0x154 0x5C NumberOfRvaAndSizes: 0x10 


>>> for k in f.sections: 


print k 


»»»f.is dll() 
False 
>>> £.is_exe() 


True 
2. 利用 pefile 模块 枚 举 DLL 的 导出 项 


>>> import pefile 
»»»pe =pefile.PE(r'C:\windows\glut32.d11") 
>>> if hasattr(pe, 'DIRECTORY ENTRY EXPORT'): 
for exp in pe.DIRECTORY ENTRY EXPORT.symbols: 
print hex (pe.OPTIONAL HEADER. ImageBaset exp.address) , \ 
exp.name, exp.ordinal 


输出 结果 ( 咯 ) 
3. 利用 pefile 和 pydasm 模块 从 PE 文件 入 口 点 开始 反 汇 编 


import pefile 
import pydasm 
import sys 


pe =pefile. PE (r"C: windows WMnotepad.exe") 


console = sys.stdout 
f =open('pe_dasm.txt', 'w') 
sys.stdout —f 


ep =pe.OPTIONAL HEADER.AddressOfEntryPoint 
ep ava = ep * pe.OPTIONAL HEADER.ImageBase 
data =pe.get memory mapped image () [ep:] 
offset =0 
while offset < len (data): 
i-pydasm.get instruction (data[offset:], pydasm.MODE 32) 
instruction —-pydasm.get instruction string(i, pydasm.FORMAT INTEL, ep avatoffset) 
if instruction !=None: 
print hex (ep *offset), '\t', instruction 
else: 


break 
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try: 
offset +=i.length 

except BaseException,e: 
break 


f£.close() 


sys.stdout =console 


4. 利用 WinAppDbg 监视 Windows API 调用 


from winappdbg import Debug, EventHandler 
import sys 
import os 


class MyEventHandler ( EventHandler ) : 


af 


# Add the APIs you want to hook 
apiHooks - ('kernel32.dll' : [( 'CreateFileW', 7)]) 


# The pre functions are called upon entering the API 
def pre CreateFileW(self, event, ra, lpFileName, dwDesiredAccess, 
dwShareMode, lpSecurityAttributes, dwCreationDisposition, 
dwFlagsAndAttributes, hTemplateFile): 
fname —event.get process().peek string(lpFileName, fUnicode- True) 
print "CreateFileW: $s" % (fname) 


# The post functions are called upon exiting the API 
def post CreateFileW(self, event, retval): 
if retval: 
print 'Suceeded (handle value: $x)' $(retval) 
else: 


print 'Failed!" 


. name  --" main ": 


if len(sys.argv) <2 or not os.path.isfile(sys.argv[1]): 
print "\nUsage: $s «File to monitor» [argl, arg2, ...]\n" $sys.argv [0] 


sys.exit() 


# Instance a Debug object, passing it the MyEventHandler instance 
debug = Debug ( MyEventHandler() ) 
try: 

#Start a new process for debugging 

p =debug.execv(sys.argv[1:], bFollow-True) 

#Wait for the debugged process to finish 

debug. loop () 


# Stop the debugger 


finally: 
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debug.stop() 


将 上 面 的 代码 保存 为 simpleapi. py 使 用 方法 与 运行 结果 如 图 16-7 所 示 。 


Settings Adninistrator \Application Data 


图 16-7 Windows API 监视 器 


本 章 知 识 精 要 


(1) 在 Windows 平台 上 ,exe 文 件 .com 文件 .dll 文件 .ocx 文件 .sys 文件 和 scr 文件 等 
都 属于 PE 文件 。 

(2) PE 文件 规范 最 新 版 本 是 2013 年 2 月 6 日 发 布 的 8.3 版 。 

(3) 在 分 析 软 件 尤其 是 软件 时 ,应 尽量 使 用 虚拟 机 或 沙 箱 系统 ,避免 本 地 物理 主机 

系统 被 感染 而 造成 不 必要 的 损失 

(4) IDA,W32DASM 4 是 成 熟 的 可 执行 文件 反 汇编 工具 ,OllyDbg、WinDbg fll Immunity 
Debugger 是 成 熟 的 软件 调试 工具 。 

(5) 通过 IDAPython 插件 可 以 在 IDA 中 运行 Python 程序 实现 自 定义 的 软件 测试 与 分 


析 功 能 。 
(6) ROP、JOP 是 近 几 年 流行 的 攻击 方式 ,目前 比较 有 效 的 防范 技术 是 CFI。 
(7) 软件 调试 时 经 常 需要 设置 断 点 .常见 的 断 点 类 型 有 软件 断 点 、 硬件 断 点 和 内 存 断 点 。 


(8) 调试 器 的 主要 工作 就 是 监视 目标 进程 的 运行 并 对 目标 执行 过 程 中 发 生 的 每 一 个 调 
试 事件 进行 相应 的 反应 和 处 理 。 


习 8 


1. 下 载 PE 文件 规范 8. 3 版 本 ,并 尝试 了 解 PE 文件 的 基本 结构 。 

2. 下 载 并 安装 IDA Pro 与 Immunity Debugger. 并 简单 了 解 PE 文件 反 汇编 和 调试 步 又。 
3. 安装 并 配置 IDAPython 插件 ,然后 运行 本 章 16. 2. 1 WAY Python 代码 。 

4. 在 Immunity Debugger 调试 器 中 运行 本 章 16. 2. 2 节 中 的 代码 。 

5. 叙述 软件 调试 断 点 的 概念 、 作 用 及 其 分 类 。 

6. 运行 16.4 节 中 的 代码 并 查看 运行 结果 。 
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第 17 章 ”科学 计算 与 可 视 化 


用 于 科学 计算 与 可 视 化 的 Python 模块 非常 多 , 例如 NumPy, SciPy、 SymPy、 
Matplotlib, Traits, TraitsUI, Chaco, TVTK, Mayavi, VPython 和 OpenCV。 其 中 , NumPy 
模块 是 科学 计算 包 , 提 供 了 Python 中 没有 的 数组 对 象 ,支持 N 维 数组 运算 、 处 理 大 型 矩阵 、 
成 熟 的 广播 函数 库 \ 矢 量 运算 、 线 性 代数 、 侍 里 叶 变 换 以 及 随机 数 生成 等 功能 ,并 可 与 C++ 、 
FORTRAN 等 语言 无 颖 结合 。SciPy 模块 依赖 于 NumPy, 提 供 了 更 多 的 数学 工具 ,包括 矩 
阵 运算 ,线性 方程 组 求解 积分 和 优化 等 。Matplotlib 是 比较 常用 的 绘图 模块 ,可 以 快速 地 
将 计算 结果 以 不 同类 型 的 图 形 展示 出 来 。 如 果 您 需要 了 解 更 多 科学 计算 与 可 视 化 模块 ,可 
以 参考 网 页 http://www. lfd. uci. edu/ —gohlke/pythonlibs/ , 

在 本 章 中 ,主要 通过 大 量 的 示例 代码 来 介绍 NumPy、SciPy、Matplotlib 几 个 模块 的 应 
用 ,如 果 您 的 计算 机 上 还 没有 安装 ,请 自行 下 载 并 安装 所 需要 的 模块 。 


17.1 NumPy 简单 应 用 


根据 大 多 数 人 的 习惯 ,往往 会 使 用 下 面 的 方式 来 导入 NumPy 模块 : 
>>> import numpy as np 
1. 生成 数组 


>>>a -np.array((1,2,3,4,5)) 

>>>b -np.array(([1,2,3], [4,5, 6], [7,8,9])) 

>>>x =np.linspace (0,5,10) 

>>>x 

array([ 0. , 0.55555556, 1.11111111, 1.66666667, 2.22222222, 

2.77777778, 3.33333333, 3.88888889, 4.44444444, 5. n 

>>> y —-np.logspace|(0,100,10) 

>>>y 

array ([ 1.00000000e+ 000, 1.29154967e* 011, 1.66810054e+ 022, 
2.15443469e+ 033, 2.78255940e+ 044, 3.59381366e+ 055, 
4.64158883e+ 066, 5.99484250e+ 077, 7.74263683e+ 088, 
1.00000000e+ 100]) 


2. 数组 与 数值 的 算术 运算 


>>>a =np.array ((1,2,3,4,5)) 
»»a*2 

array([ 2, 4, 6, 8, 10]) 
>>>a/2 

array([0, 1, 1, 2, 2]) 


《Python #2 Fri 


>>>a/2.0 
array([ 0.5, 1. , 1.5, 2. , 2.5]) 
>>>ax #2 


array([ 1, 4, 9, 16, 25]) 
3. 数组 与 数组 的 算术 运算 


>>>a -np.array((1,2,3)) 
>>>b —-np.array (([1,2,3], [4,5, 6], [7,8,9])) 
»»c-a*b 
»»»print c 

[[149] 

[4 10 18] 

[716271] 
»»»print c/b 

[[1 2 3] 

[1 2 3] 

[ 2 3]] 
>>>a =np.array ((1,2,3)) 
>>>b =np.array ((1,2,3)) 
>>>a*b 
array([1, 4, 9]) 
>>>atb 
array([2, 4, 6]) 


4. 二 维 数 组 转 置 


>>>b -np.array(([1,2,3], [4,5,6], [7,8,9])) 
»»»print b 
[[1 2 3] 
[456] 
[7 8 9]] 
»»»print b.T 
[14 7] 
[258] 
[369]] 


5. 向 量 点 积 


>>> import numpy as np 
»»»a-np.array((5,6,7)) 
»»»b-np.array((6,6,6)) 
»»»print np.dot (a,b) 
108 


6. 数组 元 素 访问 


>>> import numpy as np 
>>>b -np.array(([1,2,3], [4,5, 6], [7,8,9])) 
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»»»print b 
[[1 2 3] 

[456] 

U 89] 
>>>b[0,0] 
1 
>>>b[0] [2] 
3 


数组 元 素 还 支持 多 元 素 同 时 访问 ,例如 : 


>>>X =np.arange (0,100, 10, dtype- np. floating) 

>>>x 

array([ 0., 10., 20., 30., 40., 50., 60., 70., 80., 90.]) 
>>> index =np. random. randint (0, len (x) , 5) 

>>> index 

array ([9, 6, 3, 9, 7]) 

>>>noise -np.random.standard normal (5) * 0.3 


»»» noise 


array ([ 0.43460475, 0.57262955, —0.15114837, 0.02738525, - 0.01063617]) 


»»»x[index] 
array([ 90., 60., 30., 90., 70.]) 
»»»x[index] +=noise 


»»»x[index] 


array([ 90.02738525, 60.57262955, 29.84885163, 90.02738525, 69.98936383]) 


>>>x 

array([ 0. , 10. $20: , 29.84885163, 
40. x DB. , 60.57262955, 69.98936383, 
80. + 90.02738525]) 

»»»x[1] 

10.0 

>>>x[[1,3,5]] 

array([ 10. , 29.84885163, 50. p 

7. 三 角 函 数 运算 


>>>b -np.array(([1,2,3], [4,5,6], [7,8,9])) 
»»»print np.sin (b) 
[[ 0.84147098 0.90929743 0.14112001] 

[- 0.7568025 - 0.95892427 - 0.2794155 ] 

[ 0.6569866 0.98935825 0.41211849]] 


8. MEEA 


>>>print np. round (np. sin (b) ) 
[[1. 1. 0.] 

[-1. -1. 0.] 

[1. 1. 0.1] 
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9. XH de EA [e] 4E RE E BR ERR HET KU 


>>>x =np.arange (0,10) .reshape (2,5) 
>>>x 
array([[0, 1, 2, 3, 4], 

I5, 6, 7, 8, 9]]) 
>>>np.sum (x) 
45 
»»»np.sum(x, axis=0) 
array([ 5, 7, 9, 11, 13]) 
>>>np.sum(x, axis-1) 
array([10, 35]) 


10. 计算 矩阵 不 同 维度 上 元 素 的 均值 


>>>x =np.arange (0,10) .reshape (2,5) 
»»»np.average (x, axis =0) 

array([ 2.5, 3.5, 4.5, 5.5, 6.5]) 
»»»np. average (x,axis- 1) 


array([2., 7.]) 
11. 计算 数据 的 标准 差 与 方差 


>>>x =np.random. randint (0, 10, size= (3,3)) 
>>>x 
array ([[4, 2, 8], 
[0, 8, 9], 
(0, 2, 7]]) 
>>> np.std (x) 
3.4029761846919007 
»»»np.std(x,axis-1) 
array([ 2.49443826, 4.02768199, 2.94392029]) 
»»»np.var (x) 
11.580246913580245 


12. 对 和 矩阵 不 同 维度 上 的 元 素 求 最 大 值 


>>> 
array([[4, 2, 8], 
(0, 8, 9], 
(0, 2, 7]]) 
>>> np.max (x) 
9 
>>> np.max (x, axis=1) 


array([8, 9, 7]) 
13. SRE el 4E E E BS RET HE 


>>>x 


array([[4, 2, 8], 
[0, 8, 9], 
I0, 2, 711) 
»»»np.sort (x) 
array([[2, 4, 8], 
[0, 8, 9], 
(0, 2, 711) 
>>>np.sort (x, axis-0) 
array ([[0, 2, 7], 
[0, 2, 8], 
I4, 8, 9]]) 


14. 生成 特殊 数组 


»»»print np.zeros((3,3)) 
[[ 0. 0. 0.] 
[0. 0. 0.] 
[ 0. 0. 0.1] 
>>>print np.ones ( (3,3)) 
[[1. 1. 1.] 
| oe ee 
[1.1.1.3] 
>>>print np.identity (3) 
[[1. 0. 0.] 
[0. 1. 0.) 
[0. 0. 1.1] 
»»»np.empty ((3,3)) # 只 申请 空间 ,不 初始 化 ,速度 很 快 
array([[ 4.24510694e+ 175, 5.03061214e* 223，4.72100120e+ 164], 
[ 2.63551414e- 144, —1.00000000e+ 000, 0.00000000e+ 000] , 
[ 0.00000000e+ 000, 0.00000000e+ 000, 1.00000000e+ 000] ]) 


15. 改变 数组 大 小 


>>>a =np.arange(1,11,1) 

>>>a 

array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]) 
>>>a.shape =2,5 

>>>a 

array([[ 1, 2, 3, 4, 5], 

[ 6, 7, 8, 9, 10]]) 
>>>a.shape =5,-1 #-1 表 示 自 动 计算 
>>>a 
array({[1, 2], 

[3, 4], 

L5, 6], 

L7, 8], 

[ 9, 10]]) 
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>>>b =a. reshape (2,5) 
>>>b 
array([[ 1, 2, 3, 4, 5], 

[ 6, 7, 8, 9, 10]]) 


16. 切片 操作 


>>>a =np.arange (10) 

>>>a 

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) 

>>>a[::-1] 

array([9, 8, 7, 6, 5, 4, 3, 2, 1, 0]) 

»»»a[::2] 

array([0, 2, 4, 6, 8]) 

»»»a[:5] 

array([0, 1, 2, 3, 4]) 

>>>C 

array([[ 0, 1, 2, 3, 4, 5], 
[10, 11, 12, 13, 14, 15], 
[20, 21, 22, 23, 24, 25], 
[30, 31, 32, 33, 34, 35], 
[40, 41, 42, 43, 44, 45], 
[50, 51, 52, 53, 54, 55]]) 

>>>c[0,3:5] 


array ([3, 4]) 

»»»c[0] 

array([0, 1, 2, 3, 4, 5]) 

»»»0[2:5,2:5] 

array([[22, 23, 24], 
[32, 33, 34], 
[42, 43, 44]]) 


17. 布尔 运算 


»»»x =np. random. rand (10) 

>>>x 

array ([ 0.93874098, 0.97312716, 0.45264749, 0.74117525, 0.89758246, 
0.29755703, 0.2182093 , 0.5673035 , 0.90745768, 0.71920431]) 

>>>x>0.5 

array([ True, True, False, True, True, False, False, True, True, True], dtype=bool) 

>>>x[x>0.5] 

array ([ 0.93874098, 0.97312716, 0.74117525, 0.89758246, 0.5673035 , 
0.90745768, 0.71920431]) 

»»»np.array([1,2,3]) «np.array([3,2,11) 

array([ True, False, False], dtype- bool) 


»»»np.array([1,2,3]) ==np.array([3,2,1]) 


array([False, True, False], dtype- bool) 
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18. 取 整 运算 


>>>x —np.random.rand(10) * 50 

JFK 

array ([ 0.69708323, 14.99931488, 15.04431214, 24.60547929, 
12.12020273, 42.72638176, 16.01128916, 38.91558471, 
39.6877989 , 21.98678429]) 

»»»np.array([t-int(t) for t in x]) 

array([ 0.69708323, 0.99931488, 0.04431214, 0.60547929, 0.12020273, 
0.72638176, 0.01128916, 0.91558471, 0.6877989 , 0.98678429]) 


19. 广播 


»»»a =np.arange (0, 60,10) .reshape (- 1,1) 
>>>b -np.arange (0, 6) 

>>>a 

array([[ 0], 

10], 

20], 

30], 

40], 

5011) 

>>>b 
array([0, 1, 2, 3, 4, 5]) 
>>>atb 
array([[ 0, 1, 2, 3, 4, 5], 

10, 11, 12, 13, 14, 15], 
20, 21, 22, 23, 24, 25], 
30, 31, 32, 33, 34, 35], 
40, 41, 42, 43, 44, 45], 
50, 51, 52, 53, 54, 551]) 


20. 分 段 函数 


>>>X —np.random.randint (0,10, size- (1,10)) 

>>>x 

array([[0, 4, 3, 3, 8, 4, 7, 3, 1, 7]]) 

»»»np.where (x« 5,0,1) 

array([[0, 0, 0, 0, 1, 0, 1, 0, 0, 1]]) 

»»»x =np.random.randint (0,10, size- (1,10)) 

>>>x 

array([[3, 6, 5, 1, 0, 7, 3, 9, 6, 0]]) 

»»»np.piecewise (x, [x> 7, x« 4], [lambda x:x* 2, lambda x:x * 3,0]) 
array([[ 9, 0, 0, 3, 0, 0, 9, 18, 0, 011) 


21. 计算 唯一 值 以 及 出 现 次 数 


>>>x =np-random.randint (0,10, 10) 
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>>> x 

array([4, 7, 3, 6, 7, 4, 1, 9, 4, 81) 
>>>np-bincount (x) 

array([0, 1, 0, 1, 3, 0, 1, 2, 1, 1]) 
»»»np.unique (x) 

array([1, 3, 4, 6, 7, 8, 9]) 


22. 计算 加 权 平 均值 


>>>x =np.random. randint (0,10,10) 

>>>x 

array ([7, 8, 5, 8, 0, 7, 9, 9, 9, 7]) 

>>>y -np.array([round(i,1) for i in list (np.random.random(10))]) 
»y 

array([ 0.6, 0.8, 0.8, 0. , 0.6, 0.1, 0. , 0.2, 0.8, 0.7]) 
>>>np.sum(x* y) /np.sum (np.bincount (x) ) 

2.9199999999999999 


23. 矩阵 运算 


>>> import numpy as np 

>>>a list = [3,5,7] 

>>>a mat -np.matrix(a list) 
>>>a mat 

matrix([[3, 5, 7]]) 
»»»np.shape (a mat) 

(1, 3) 

>>>b mat =np.matrix((1,2,3)) 
>>>b mat 

matrix([[1, 2, 3]]) 

>>>a mat * b mat.T 
matrix([[34]]) 

»»»a mat.argsort() # 返 回 每 个 元 素 的 排序 序号 
matrix([[0, 1, 2]]) 

>>> a_mat .mean () 

5.0 

>>>a_mat.sum() 

15 

»»»a mat.max() 

1 


17.2 SciPy 简单 应 用 


SciPy 是 在 NumPy 的 基础 上 增加 了 大 量 用 于 数学 计算 、 科 学 计算 以 及 工程 计算 的 模 


块 ,包括 线性 代数 、 常 微分 方程 数值 求解 ,信号 处 理 、 图 像 处 理 和 稀 玖 矩阵 等 。SciPy 主要 模 
块 如 表 17-1 所 示 。 
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表 17-1 SciPy 主要 模块 


模 块 说 明 
constants | 常数 
special 特殊 函数 
opinie Paire ,如 最 小 二 乘 拟 合 (leastsq) 、 函 数 最 小 值 (fmin 系列 ) 、 非 线性 方程 组 求解 


interpolate | 插值 (interpld 、interp2d 等 ) 
integrate 数值 积分 
signal 信和 号 处 理 


图 像 处 理 , 包 括 filters 滤波 器 模块 fourier 传 里 叶 变 换 模 块 interpolation 图 像 插 值 模块 、 
measurements 图 像 测 量 模块 ,morphology 形态 学 图 像 处 理 模块 等 


stats 统计 


ndimage 


17.2.1 常数 与 特殊 函数 
SciPy 的 constants 模块 包含 了 大 量 用 于 科学 计算 的 常数 ,详情 可 以 查看 http://docs. 


scipy. org/doc/scipy/reference/constants. html, 


例如 ,可 以 使 用 下 面 的 方法 来 访问 该 模块 中 预定 义 的 常数 : 


>>> from scipy import constants as C 


>>>C.c # 真 空中 的 光速 
299792458.0 

>>>C.h # 普 朗 克 常 数 
6.62606896e- 34 

>>>C.mile # 一 英里 等 于 多 少 米 
1609.3439999999998 

»»»C.inch # 一 英寸 等 于 多 少 米 
0.0254 

»»»C.degree # 一 度 等 于 多 少 弧度 
0.017453292519943295 

>>>C.minute # 一 分 钟 等 于 多 少 秒 
60.0 


此 外 ,SciPy 模块 的 special 模块 包含 大 量 函 数 库 , 包 括 基本 数学 函数 、 特 殊 函 数 以 及 
NumPy 中 的 所 有 函数 。 


>>> from scipy import special as S 

>>>x = [0, np.pi/2, np.pi, np.pi* 1.5, np.pi* 2] 

2»»S.sin(x) 

array ([ 0.00000000e 00, 1.00000000e+ 00, 1.22464680e- 16, 
—1.00000000e+ 00, — 2.44929360e- 16]) 

>>>x = [1, 2*3j, 4-55] 

>>>S.conjugate (x) HHZ 
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array([ 1.-0.j，2.-3.j，4.+5.j]) 
>>>S-gamma (4) # gamma 函数 
6.0 


17.2.2 SciPy 简单 应 用 


中 值 滤 波 是 数字 信号 处 理 、 数 字 图 像 处 理 中 常用 的 预 处 理 技术 。 该 技术 的 特点 是 将 信 


号 中 每 个 值 都 替换 为 其 邻 域内 的 中 值 , 即 邻 域内 所 有 值 排序 后 中 间 位 置 上 的 值 。 下 面 通过 
两 个 示例 来 演示 SciPy 模块 中 中 值 滤波 的 实现 和 应 用 。 


导致 了 一 些微 小 的 失真 。 另 外 ,由 于 使 用 了 随机 数 ， 
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>>> import random 

>>> import numpy as np 

>>> import scipy.signal as signal 

»»»x =np.arange (0,100,10) 

>>> random. shuffle (x) 

>>>x 

array([40, 0, 60, 20, 50, 70, 80, 90, 30, 10]) 

>>> signal.medfilt (x,3) 

array([ 0., 40., 20., 50., 50., 70., 80., 80., 30., 10.1) 


下 面 的 代码 使 用 中 值 滤波 实现 了 信号 去 噪 ,并 将 处 理 前 后 的 信号 值 进行 了 对 比 : 


import numpy as np 

import scipy.signal as signal 

x =np.arange (0,6,0.1) 

y =np.sin(x) 

z =y.copy() 

print '='* 20 

print 'y:' 

print y 

print '='* 20 

print 'before adding noise.z- y:" 
print z- y 

index —np.random.randint (0, len (x) , 20) 
noise =np.random.standard_normal (20) * 0.8 
z[index]*- noise 

print '-'* 20 

print 'after adding noise.z- y:' 

print z-y 

result =signal .medfilt (z, 3) 

print '-'* 20 

print 'after median filtering.z-y:' 


print result- y 


运行 结果 如 下 ,可 以 看 到 ,经 过 中 值 滤波 处 理 之 后 ,信号 整体 更 加 接近 原始 值 , 但 同时 也 
运行 该 程序 时 得 到 的 结果 与 下 面 看 到 的 


[ 0: 0.09983342 0.19866933 0.29552021 
0.56464247 0.64421769  0.71735609 0.78332691 
0.93203909 0.96355819  0.98544973 0.99749499 
0.97384763 0.94630009  0.90929743  0.86320937 
0.67546318 0.59847214  0.51550137  0.42737988 

0.14112001 0.04158066 | -0.05837414 -0.15774569 

— 0.44252044 —0.52983614 -0.61185789 -0.68776616 

-0.87157577 —0.91616594 -0.95160207 -0.97753012 

- 0.99616461 —0.98245261 -0.95892427 -0.92581468 

-0.77276449 —0.70554033 -0.63126664 -0.55068554 

before adding noise.z- y: 
[0. 0. 0. 0. O. O. 0. O. O. 0. 0. 
0. 0. 0. O. O. O0. O. O. O. O0. 0. 
0. 0. 0. O. O. 0. O. O. 0. O0. 0. 
0. 0. 0. O. 0. O.] 
after adding noise.z- y: 
[ 0.25949491 0. 0. —-1.50601958 
- 0.57822021 0. 1.69250421 0. 
0. 0. —0.06843014  1.51711964 
0. 0. 0. 0.48069333 
0. —0.63580858 -0.62972023 0. 
0. 0. 0. 0. 
— 0.61507477 0 0.01639333 0. 
-1.10931122 0. 0. 0. 
0. 0. 0. 一 0.39571393 
0. 0 0. 0. 
after median filtering.z- y: 
[ 0.09983342 0.09883591 —0.09883591 - 0.09685088 
- 0.08521693 0. 0.06597082  0.05814408 
0. —0.02189154 -0.01204526 - 0.00790879 
—- 0.03700266 0. 0.04608806 0.05471296 
0. —0.63580858 -0.54768709 —0.09573882 
0. 0. 0. 0. 
—-0.07590827 .-0.05264301  0.01639333 0. 


—0.02592804 .-0.01616089 0. 
0. —0.04236003 —-0.05118721 
0. 0. 0. 


0.38941834 
0.84147098 
0.9995736 
0.8084964 
0.33498815 
— 0.2555411 
— 0.7568025 
— 0.993691 

— 0.88345466 
— 0.46460218 


—ooocoooososo 


-48388944 


0.47942554 
0.89120736 
0.99166481 
0.74570521 
0.23924933 
— 0.35078323 
—0.81827711 
—0.99992326 
— 0.83226744 
— 0.37387666. 


o 
Ei 


-92222652 
-55413147 


-71545621 


ooooooooo 


-08390631 


.0900072 


.02754754 


0 
0 
0 
0.07024203 
0 
0 


0. 


0.00375865 —0.00375865 - 0.013712 


0. 
1 


0.07427369 


0.00963262 


1 


0. 
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17.3 Matplotlib 简单 应 用 


Matplotlib 模块 依赖 于 NumPy 模块 和 tkinter 模块 , 它 可 以 绘制 多 种 形式 的 图 形 , 包 括 
线 图 、 直 方 图 、 饼 状 图 、 散 点 图 和 误差 线 图 等 ,是 计算 结果 可 视 化 的 重要 工具 。 
1. 绘制 正弦 曲线 


>>> import numpy as np 

>>> import pylab as pl 

>>>t =np.arange (0.0, 2.0* np.pi, 0.01) 
>>>s =np.sin(t) 

>>>pl.plot (t,s) 

>>>pl.xlabel('x') 

>>>pl.ylabel('y') 

>>>pl.title('sin') 

>>>pl.show() 


运行 结果 如 图 17-1 所 示 。 


H10/0|+/+| elma 


图 17-1 使 用 Matplotlib 绘制 正弦 曲线 


2. 绘制 散 点 图 


>>>a -np.arange(0, 2.0* np.pi, 0.1) 
>>>b =np.cos (a) 
>>>pl.scatter (a,b) 


»»»pl.show() 


— — — 1282. 


运行 结果 如 图 17-2 所 示 。 


人 |@|©| 十 | 于 | 图 园 


图 17-2 绘制 余弦 曲线 散 点 图 


下 面 的 代码 使 用 随机 数 生成 数值 ,并 根据 数值 大 小 来 计算 散 点 的 大 小 。 


>>> import matplotlib.pylab as pl 

>>> import numpy as np 

>>>x =np. random. random (100) 

>>> y =np. random. random (100) 

>>>pl.scatter (x, y, s- x * 500,c-u'r',marker-u' * ') #s 指 大 小 ,c 指 颜色 ,marker 指 符号 形状 
>>>pl.show() 


运行 结果 如 图 17-3 所 示 。 
3. 使 用 pyplot 绘制 .多 个 图 形 在 一 起 显示 


import numpy as np 

import matplotlib.pyplot as plt 

x =np.linspace(0, 2* np.pi, 500) 

y =np.sin(x) 

z —np.cos (x * x) 

plt.figure (figsize= (8,4)) 

# 标 签 前 后 加 $ 将 使 用 内 其 的 LaTex 引擎 将 其 显示 为 公式 

plt.plot (x, y, label= '$sin(x)$ ',color- 'red',linewidth-2) # 红 色 ,2 个 像素 宽 
plt.plot (x, z, 'b- - ', label= '$cos (x^2)$ ') # 蓝 色 ,虚线 
plt.xlabel('Time(s)') 

plt.ylabel('Volt') 

plt.title('Sin and Cos figure using pyplot') 
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图 17-3 绘制 星 形 散 点 图 


plt.ylim(-1.2,1.2) 


plt.legend() 


plt.show() 


# 显 示 图 示 


+ 显示 绘图 窗口 


上 面 的 代码 运行 结果 如 图 17-4 Bron o 


图 17-4 同时 绘制 多 个 图 形 


4. 使 用 pyplot 绘制 .多 个 图 形 单独 显示 


import numpy as np 


import matplotlib.pyplot as plt 
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x-np.linspace(0, 2* np.pi, 500) 
yl =np.sin (x) 

y2 =np.cos (x) 

y3 =np.sin(x* x) 

#create figure 

plt. figure (1) 

# create three axes 

# first line, first column 
axl =plt.subplot (2,2,1) 

# first line, second column 
ax2 =plt.subplot (2,2,2) 

# the whole second line 
ax3 =plt.subplot (2,1,2) 

# choose axl 

plt.sca (ax1) 

# draw the curve in axl 
plt.plot (x, yl,color= 'red') 
plt.ylim(-1.2,1.2) 

# choose ax2 

plt.sca (ax2) 

plt.plot (x, y2, 'b- - ') 
plt.ylim(-1.2,1.2) 

# choose ax3 

plt.sca (ax3) 

plt.plot (x, y3, 'g- - ') 
plt.ylim(-1.2,1.2) 
plt.legend() 

plt.show() 


运行 结果 如 图 17-5 所 示 o 
5. 绘制 三 维 图 形 


import numpy as np 
import matplotlib.pyplot as plt 
import mpl toolkits.mplot3d 


z=50 * np.sin(xty) 
ax =plt.subplot (111, projection- '3d') 
ax.plot_surface(x,y,z,rstride=2, cstride=1, cmap-plt.cm.Blues r) 
ax.set xlabel('X') 

ax.set ylabel('Y') 

ax.set zlabel('Z') 

plt.show() 


运行 结果 如 图 17-6 所 示 ,在 绘图 窗口 中 可 用 鼠标 来 旋转 所 绘制 图 形 : 
下 面 的 代码 绘制 了 另 一 个 略 加 复杂 的 三 维 图 形 . 
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图 17-5 绘制 多 个 图 形 


.y7-0.878612 ,2-88.1515 


x--3.71512 


import pylab as pl 


import numpy as np 
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科学 计算 与 可 视 化 


import mpl toolkits.mplot3d 
rho, theta —np.mgrid[0:1:40j, 0:2* np.pi:40j] 
z =rhok*2 

x —rho* np.cos (theta) 

y 7 rho* np.sin(theta) 

ax —pl.subplot (111, projection- '3d') 

ax.plot surface (x,y, z) 


pl.show() 


运行 结果 如 图 17-7 所 示 。 


fj0/6-- =| Ss 


图 17-7 绘制 三 维 图 形 


本 章 知 识 精 要 


(1) 比较 常用 的 科学 计算 可 视 化 模块 有 NumPy、SciPy 和 Matplotlib. 

(2) NumPy 支持 数组 与 标量 的 运算 数组 与 数组 的 运算 、 向 量 内 积 、 数 组 的 三 角 函 数 运 
算 、 数 组 多 元 素 操作 ,不 同 维 度 的 最 大 值 与 均值 计算 、 切 片 操作 、 计 算 标 准 差 与 方差 以 及 特殊 
数组 生成 等 功能 。 
(3) SciPy 模块 依赖 于 NumPy 模块 ,在 其 基础 上 增加 了 大 量 用 于 数学 计算 、 科 学 计算 
以 及 工程 计算 的 模块 ,包括 线性 代数 、 常 微分 方程 数值 求解 ,信号 处 理 、 图 像 处 理 和 稀 跑 和 矩 

(4) Matplotlib 模块 依赖 于 NumPy 和 tkinter 模块 ,可 以 绘制 多 种 形式 的 图 形 ,包括 线 
图 、 直 方 图 、 饼 状 图 和 散 点 图 等 ,是 科学 计算 可 视 化 的 重要 工具 。 
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4 a 


1. 运行 本 章 所 有 代码 并 查看 运行 结 
2. 使 用 Python 内 置 函数 dir() 查 看 Scipy 模块 中 的 对 象 与 方法 ,并 使 用 Python 内 置 函 
数 help() 查 看 其 使 用 说 明 。 
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